Подавление и подавление эха - Echo suppression and cancellation

Подавление эха и эхоподавление методы, используемые в телефония для улучшения качества голоса, предотвращая эхо от создания или удаления после того, как он уже присутствует. Помимо улучшения субъективного качества звука, подавление эха увеличивает пропускную способность, достигаемую за счет подавление тишины предотвращая распространение эха через телекоммуникационная сеть. Подавители эха были разработаны в 1950-х годах в ответ на первое использование спутников для телекоммуникаций, но с тех пор они были в значительной степени вытеснены более эффективными компенсаторами эха.

Методы подавления и подавления эха обычно называются подавление акустического эха (AES) и подавление акустического эха (AEC), реже подавление эха линии (LEC). В некоторых случаях эти термины более точны, поскольку существуют различные типы и причины эха с уникальными характеристиками, включая акустическое эхо (звуки от громкоговорителя, отражаемые и записываемые микрофоном, которые могут существенно меняться со временем) и линейное эхо ( электрические импульсы, вызванные, например, связью между передающим и принимающим проводами, несоответствием импеданса, электрическими отражениями и т. д.[1] который меняется намного меньше, чем акустическое эхо). На практике, однако, для обработки всех типов эхо используются одни и те же методы, поэтому акустический компенсатор эха может подавлять линейное эхо, а также акустическое эхо. AEC в частности, обычно используется для обозначения эхоподавителей в целом, независимо от того, были ли они предназначены для акустического эха, линейного эха или того и другого.

Хотя эхоподавители и эхоподавители имеют схожие цели - не дать говорящему человеку услышать эхо собственного голоса, - методы, которые они используют, различны:

  • Подавители эха работают обнаружение голосового сигнала идет в одном направлении по цепи, а затем заглушает или ослабляет сигнал в другом направлении. Обычно подавитель эха на дальнем конце цепи делает это приглушение, когда обнаруживает голос, исходящий от ближнего конца цепи. Это отключение не позволяет говорящему слышать собственный голос, возвращающийся с дальнего конца.
  • Подавление эха включает в себя сначала распознавание первоначально переданного сигнала, который повторно появляется с некоторой задержкой в ​​переданном или принятом сигнале. Как только эхо распознается, его можно удалить, вычтя его из переданного или принятого сигнала. Этот метод обычно реализуется в цифровом виде с использованием цифровой сигнальный процессор или программное обеспечение, хотя оно также может быть реализовано в аналоговых схемах.[2]

Стандарты ITU G.168 и Стр.340 описать требования и тесты для эхоподавителей в цифровом и PSTN приложения соответственно.

История

В телефония, эхо - это отраженная копия голоса, услышанная спустя некоторое время. Если задержка довольно значительная (более нескольких сотен миллисекунд), это считается раздражающим. Если задержка очень мала (10 миллисекунд или меньше[3]) явление называется самопрослушивание. Если задержка немного больше, около 50 миллисекунд, люди не смогут услышать эхо как отдельный звук, а вместо этого услышат звук. эффект хора.[3]

На заре телекоммуникаций подавление эха использовалось, чтобы уменьшить нежелательный характер эха для пользователей. Один человек говорит, а другой слушает, и они говорят взад и вперед. Подавитель эха пытается определить, какое направление является основным, и позволяет этому каналу идти вперед. В обратном канале он помещает затухание заблокировать или подавлять любой сигнал при условии, что это эхо-сигнал. Хотя подавитель эффективно справляется с эхом, такой подход приводит к ряду проблем, которые могут расстраивать обе стороны вызова.

  • Двойной разговор: В разговоре вполне нормально, когда обе стороны говорят одновременно, по крайней мере, кратко. Поскольку каждый подавитель эха затем будет обнаруживать энергию голоса, исходящую от дальнего конца цепи, эффект обычно заключается в том, что потери вносятся одновременно в обоих направлениях, эффективно блокируя обе стороны. Чтобы предотвратить это, можно настроить подавители эха для обнаружения речевой активности из динамика на ближнем конце и для того, чтобы не вносить потери (или вносить меньшие потери), когда говорят и динамик на ближнем, и на дальнем конце. Это, конечно, временно отменяет основной эффект наличия подавителя эха.
  • Отсечение: поскольку подавитель эха попеременно вставляет и удаляет потери, часто возникает небольшая задержка, когда новый говорящий начинает говорить, что приводит к отсечению первого слога из речи этого говорящего.
  • Мертвая установка: если абонент на дальнем конце вызова находится в шумной среде, динамик на ближнем конце будет слышать этот фоновый шум, пока говорящий на дальнем конце говорит, но подавитель эха подавит этот фоновый шум, когда ближайший динамик -конечный динамик начинает говорить. Внезапное отсутствие фонового шума создает у ближнего пользователя впечатление, что линия оборвалась.

В ответ на это Bell Labs разработал теорию подавления эха в начале 1960-х годов,[4][5] что затем привело к появлению лабораторных эхоподавителей в конце 1960-х и коммерческих эхоподавителей в 1980-х.[6] Компенсатор эха генерирует оценку эха из сигнала говорящего и вычитает эту оценку из обратного пути. Этот метод требует адаптивный фильтр для генерации сигнала, достаточно точного, чтобы эффективно подавить эхо, когда эхо может отличаться от оригинала из-за различных видов ухудшения на этом пути. С момента изобретения в AT&T Bell Labs[5] Алгоритмы эхоподавления были улучшены и отточены. Как и все процессы подавления эха, эти первые алгоритмы были разработаны, чтобы предвидеть сигнал, который неизбежно снова войдет в тракт передачи, и нейтрализовать его.

Быстрый прогресс в цифровая обработка сигналов позволили уменьшить размеры эхоподавителей и сделать их более экономичными. В 1990-х годах эхоподавители были внедрены в голосовые переключатели впервые (в Северном Телекоме ДМС-250 ), а не как отдельные устройства. Интеграция эхоподавления непосредственно в коммутатор означала, что эхоподавители можно было надежно включать и выключать для каждого вызова, устраняя необходимость в отдельных группах соединительных линий для голосовых вызовов и вызовов данных. Современные технологии телефонии часто используют эхоподавители в небольших или портативных устройствах связи с помощью программного обеспечения. голосовой движок, который обеспечивает подавление либо акустического эха, либо остаточного эха, вносимого системой шлюза PSTN на дальнем конце; такие системы обычно подавляют отражения эха с задержкой до 64 миллисекунд.

Операция

Адаптивный эхоподавитель для телефонной сети. Функция ЧАС, то гибридный трансформатор, заключается в маршрутизации входящей речи с дальнего конца Иксk на местный телефон и перенаправьте речь с телефона на дальний конец. Однако гибрид никогда не бывает идеальным, поэтому его производительность dk содержит как желаемую речь с местного телефона, так и отфильтрованную речь с дальнего конца. Эхоподавитель - это адаптивный фильтр. жk, который пытается минимизировать сигнал ошибки εk путем фильтрации входящей речи на дальнем конце в реплику уk речи на дальнем конце, которая просачивается через гибрид. После завершения адаптации сигнал ошибки состоит в основном из речи с местного телефона.

Процесс эхоподавления работает следующим образом:

  1. В систему доставляется сигнал с дальнего конца.
  2. Воспроизводится сигнал на дальнем конце.
  3. Сигнал на дальнем конце фильтруется и задерживается, чтобы напоминать сигнал на ближнем конце.
  4. Отфильтрованный сигнал на дальнем конце вычитается из сигнала на ближнем конце.
  5. Результирующий сигнал представляет звуки, присутствующие в комнате, за исключением любого прямого или реверберированного звука.

Основная задача для компенсатора эха - определить характер фильтрации, которая будет применяться к сигналу на дальнем конце, чтобы он напоминал результирующий сигнал на ближнем конце. По сути, фильтр - это модель динамика, микрофона и акустических характеристик комнаты. Компенсаторы эха должны быть адаптивными, поскольку характеристики динамика и микрофона на ближнем конце, как правило, заранее неизвестны. Акустические характеристики комнаты ближнего конца также обычно не известны заранее и могут измениться (например, если микрофон перемещается относительно динамика, или если люди ходят по комнате, вызывая изменения в акустических отражениях).[2][7] Используя сигнал дальнего конца в качестве стимула, современные системы используют адаптивный фильтр и могут сходиться от без отмены до 55 дБ подавления примерно за 200 мс.[нужна цитата ]

До недавнего времени эхоподавление применялось только к полосе пропускания голоса в телефонных цепях. PSTN называет частоты передачи от 300 Гц до 3 кГц, диапазон, необходимый для разборчивости речи человека. Видео-конференция это одна из областей, где используется звук с полной полосой пропускания. В этом случае для эхоподавления используются специализированные продукты.

Поскольку подавление эха имеет известные ограничения, в идеальной ситуации будет использоваться только подавление эха. Однако этого недостаточно для многих приложений, особенно программных телефонов в сетях с большой задержкой и низкой пропускной способностью. Здесь эхоподавление и подавление могут работать вместе для достижения приемлемой производительности.

Количественная оценка эха

Эхо измеряется как эхо-возвратные потери (ERL). Это соотношение, выраженное в децибелы, оригинала и его эха.[8] Высокие значения означают, что эхо очень слабое, а низкие значения означают, что эхо очень сильное. Отрицательный означает, что эхо-сигнал сильнее исходного сигнала, что, если его не отметить, вызовет звуковая обратная связь.

Производительность эхоподавителя измеряется в усиление возвратных потерь эха (ERLE),[3][9] который представляет собой величину дополнительных потерь сигнала, применяемых эхоподавителем. Большинство эхоподавителей могут применять ERLE от 18 до 35 дБ.

Полная потеря сигнала эха (ACOM) является суммой ERL и ERLE.[9][10]

Текущее использование

Источники эха встречаются в повседневной среде, например:

  • Автомобильные телефонные системы громкой связи
  • Стандартный телефон или мобильный телефон в громкая связь Режим
  • Выделенные автономные спикерфоны
  • Установлены конференц-зал системы, в которых используются потолочные динамики и микрофоны на столе
  • Физическая связь, когда колебания громкоговоритель передача на микрофон через трубка кожух

В некоторых из этих случаев звук из динамика поступает в микрофон почти без изменений. Сложности с подавлением эха связаны с изменением исходного звука окружающим пространством. Эти изменения могут включать поглощение определенных частот мягкой мебелью и отражение разных частот с разной силой.

Внедрение AEC требует инженерных знаний и быстрого процессора, обычно в виде цифровой сигнальный процессор (DSP), затраты на обработку могут оказаться чрезмерными, однако многие встроенные системы действительно имеют полнофункциональный AEC.

Умные колонки и интерактивный голосовой отклик системы, которые принимают речь для ввода, используют AEC при воспроизведении речевых подсказок, чтобы система распознавания речи не могла ложно распознать отраженные подсказки и другой вывод.

Модемы

Стандартные телефонные линии используют одну и ту же пару проводов для отправки и приема звука, что приводит к тому, что небольшая часть исходящего сигнала отражается обратно. Это полезно для людей, разговаривающих по телефону, поскольку дает говорящему сигнал о том, что их голос проходит через систему. Однако этот отраженный сигнал вызывает проблемы для модема, который не может отличить сигнал от удаленного модема от эха собственного сигнала.

По этой причине ранее коммутируемые модемы разделять частоты сигнала, чтобы устройства на обоих концах использовали разные тона, позволяя каждому игнорировать любые сигналы в частотном диапазоне, который он использовал для передачи. Однако это уменьшило доступную для обеих сторон полосу пропускания.

Эхоподавление смягчило эту проблему. В течение периода установления вызова и согласования оба модема отправляют серию уникальных тональных сигналов, а затем ожидают их возврата через телефонную систему. Они измеряют общее время задержки, затем настраивают линия задержки за тот же период. Как только соединение установлено, они отправляют свои сигналы в телефонные линии как обычно, но также и в линию задержки. Когда их сигнал отражается обратно, он смешивается с инвертированным сигналом от линии задержки, что нейтрализует эхо. Это позволило обоим модемам использовать весь доступный спектр, удвоив возможную скорость.

Эхоподавление также применяется многими операторами связи к самой линии и может вызывать повреждение данных, а не улучшать сигнал. Некоторые телефонные коммутаторы или преобразователи (например, аналоговые оконечные адаптеры) отключают подавление эха или эхоподавление при обнаружении 2100 или 2225 Гц. тоны ответа связанных с такими звонками, в соответствии с ITU-T рекомендация G.164 или же G.165.

ISDN и DSL модемы работает на частотах выше полосы голоса сверх стандартной витая пара телефонные провода также используют автоматическое эхоподавление для одновременной двунаправленной передачи данных. Вычислительная сложность при реализации адаптивного фильтра значительно снижена по сравнению с подавлением речевого эха, поскольку сигнал передачи представляет собой цифровой поток битов. Вместо операции умножения и сложения для каждого крана в фильтре требуется только сложение. А баран схема подавления эха на основе таблицы поиска[11][12] исключает даже операцию сложения, просто обращаясь к памяти с усеченным потоком битов передачи для получения оценки эхо-сигнала. С развитием полупроводниковой технологии подавление эха теперь обычно реализуется с помощью Цифровой сигнальный процессор (DSP) техники.

Некоторые модемы используют отдельные входящие и исходящие частоты или выделяют отдельные временные интервалы для передачи и приема, чтобы исключить необходимость в эхоподавлении. Более высокие частоты, превышающие пределы первоначальной конструкции телефонных кабелей, значительно страдают искажение затухания из-за мостовые краны и неполный согласование импеданса. Часто возникают глубокие узкие промежутки между частотами, которые невозможно устранить с помощью эхоподавления. Они обнаруживаются и отображаются во время согласования соединения.

Смотрите также

Рекомендации

  1. ^ «Octasic: улучшение качества голоса и подавление эха». Архивировано из оригинал на 2014-08-21. Получено 14 апреля 2014.
  2. ^ а б Энерот, Питер (2001). Стереофоническое подавление акустического эха: теория и реализация (PDF) (Тезис). Лундский университет. ISBN  91-7874-110-6. ISSN  1402-8662. Получено 2015-06-25.
  3. ^ а б c «Эхо в системах передачи голоса по IP». Получено 2 июля 2014.
  4. ^ Сонди, Ман Мохан (март 1967). «Адаптивный эхоподавитель» (PDF). Технический журнал Bell System. 46 (3): 497–511. Дои:10.1002 / j.1538-7305.1967.tb04231.x. Архивировано из оригинал (PDF) на 2014-04-16. Получено 14 апреля 2014.
  5. ^ а б США 3500000 
  6. ^ Мурано, Кадзуо; Унагами, Сигеюки; Амано, Фумио (январь 1990 г.). «Эхоподавление и приложения» (PDF). Журнал IEEE Communications. 28 (1): 49–55. Дои:10.1109/35.46671. ISSN  0163-6804. Получено 14 апреля 2014.
  7. ^ Охгрен, Пер (ноябрь 2005 г.). «Подавление акустического эха и обнаружение двойного разговора с использованием расчетных импульсных характеристик громкоговорителей» (PDF). Транзакции IEEE по обработке речи и звука. 13 (6): 1231–1237. CiteSeerX  10.1.1.530.4556. Дои:10.1109 / TSA.2005.851995.
  8. ^ «Что такое возвратные потери эха (ERL) и как они влияют на качество голоса?». Архивировано из оригинал на 2015-06-26.
  9. ^ а б «Анализ эха для передачи голоса по IP». Cisco Systems. Получено 2 июля 2014.
  10. ^ Косанович, Богдан (11.04.2002). «Подавление эха, часть 1: основы и подавление акустического эха». EE Times. Получено 7 июля 2014.
  11. ^ Holte, N .; Стуэфлоттен, С. «Новый цифровой эхоподавитель для двухпроводных абонентских линий». Транзакции IEEE по коммуникациям. 29 (11): 1573–1581. Дои:10.1109 / TCOM.1981.1094923. ISSN  1558-0857.
  12. ^ Патент США 4237463 [1], «Направленный ответвитель», выдан 1978-10-20 

внешняя ссылка