Линейное предсказание смешанного возбуждения - Mixed-excitation linear prediction
Эта статья нужны дополнительные цитаты для проверка.Февраль 2018 г.) (Узнайте, как и когда удалить этот шаблон сообщения) ( |
Линейное предсказание смешанного возбуждения (MELP) это Министерство обороны США кодирование речи стандарт, используемый в основном в военный приложения и спутник коммуникации, безопасный голос и безопасные радиоустройства. Его стандартизация и последующие разработки проводились и поддерживались АНБ и НАТО.
История
Первоначальный MELP был изобретен Аланом МакКри примерно в 1995 году. [1] будучи аспирантом Центра обработки сигналов и изображений (CSIP) Технологического института Джорджии, срок действия оригинальных патентов, связанных с MELP, истек. Этот первоначальный речевой кодер был стандартизирован в 1997 году и был известен как MIL-STD-3005.[2] Он превзошел других кандидатов-вокодеров в конкурсе Министерства обороны США, в том числе: (а) Частотно-селективный кодер гармоник (FSHC), (б) Продвинутое многополосное возбуждение (AMBE), (c) Улучшенное многополосное возбуждение (EMBE), (d) Кодер преобразования синусоиды (STC) и (e) Кодер поддиапазона LPC (SBC). Из-за меньшей сложности[нужна цитата ] чем кодер интерполяции формы волны (WI), вокодер MELP выиграл конкурс DoD и был выбран для MIL-STD -3005.
MIL-STD-3005
В период с 1998 по 2001 год новый вокодер на основе MELP был создан с половинной скоростью (т.е. 1200 бит / с), а в MIL-STD-3005 были внесены существенные улучшения. SignalCom (позже приобретен Microsoft ) и Корпорация AT&T, который включал (а) дополнительный новый вокодер с половинной скоростью (т.е. 1200 бит / с), (б) существенно улучшенное кодирование (анализ), (в) существенно улучшенное декодирование (синтез), (г) предварительную обработку шума для удаления фона шум, (e) перекодирование между потоками 2400 бит / с и 1200 бит / с, и (f) новый постфильтр. Эта довольно значительная разработка была направлена на создание нового кодировщика с половинной скоростью и совместимость со старым стандартом MELP. Этот расширенный MELP (также известный как MELPe) был принят как новый MIL-STD-3005 в 2001 году в виде приложений и дополнений к исходному MIL-STD-3005, обеспечивая то же качество, что и старый MELP со скоростью 2400 бит / с. в два раза меньше. Одно из самых больших преимуществ нового MELPe со скоростью 2400 бит / с заключается в том, что он использует тот же битовый формат, что и MELP, и, следовательно, может взаимодействовать с устаревшими системами MELP, но будет обеспечивать лучшее качество на обоих концах. MELPe обеспечивает гораздо лучшее качество, чем все старые военные стандарты, особенно в шумных средах, таких как поле боя, автомобили и самолеты.
STANAG-4591 (НАТО)
В 2002 году, после обширных соревнований и испытаний, US DoD MELPe со скоростью 2400 и 1200 бит / с был также принят как НАТО стандарт, известный как СТАНАГ -4591.[3] В рамках тестирования НАТО на соответствие новому стандарту НАТО MELPe был протестирован против других кандидатов, таких как Франция HSX (гармоническое стохастическое возбуждение) и индюк SB-LPC (Split-Band Linear Predictive Coding), а также старые стандарты безопасной передачи голоса, такие как FS1015 LPC-10e (2,4 кбит / с), FS1016 CELP (4,8 кбит / с) и CVSD (16 кбит / с). Впоследствии MELPe также выиграл конкурс НАТО, превзойдя по качеству всех других кандидатов, а также по качеству всех старых стандартов защищенной голосовой связи (CVSD, CELP и LPC-10e ). В НАТО Конкурс пришел к выводу, что MELPe существенно улучшил производительность (с точки зрения качества речи, разборчивости и помехозащищенности) при одновременном снижении требований к пропускной способности. Тестирование НАТО также включало тесты на совместимость, использовало более 200 часов речевых данных и проводилось в 3 испытательных лабораториях по всему миру.
В 2005 г. был выпущен новый вариант MELPe со скоростью 600 бит / с. Thales Group (Франция ) был добавлен (без обширной конкуренции и тестирования, как это было выполнено для MELPe 2400/1200 бит / с) [4] по стандарту НАТО STANAG-4591.
300 бит / с MELP
В 2010 году Lincoln Labs., BBN и General Dynamics также разработали для DARPA устройство MELP со скоростью 300 бит / с.[5] Его качество было лучше, чем у MELPe со скоростью 600 бит / с, но задержка была больше.
Реализации
MELPe был реализован во многих приложениях, включая защищенные радиоустройства, спутниковую связь, VoIP и приложения для мобильных телефонов. В таких приложениях требуются дополнительные знания для борьбы с ошибками канала, потерей пакетов и синхронизацией. Такой опыт требует понимания чувствительности битов MELPe к ошибкам. MELPe 2400 бит / с и 1200 бит / с включает бит синхронизации, который полезен при последовательной связи.
Уровень сжатия
MELPe предназначен для сжатия речи. Для аудиовхода, дискретизированного с частотой 8 кГц, кодек MELPe обеспечивает следующие коэффициенты сжатия в потоке данных G.711 по μ-закону 64 кбит / с, не считая влияния служебных данных протокола:
Битрейт | Степень сжатия по G.711 | Размер полезной нагрузки | Интервал полезной нагрузки |
---|---|---|---|
2400 бит / с | 26,7 х | 54 бит | 22,5 мс |
1200 бит / с | 53,3 Х | 81 бит | 67,5 мс |
600 бит / с | 106,7 х | 54 бит | 90 мс |
Как правило, кодирование речи включает в себя компромисс между различными аспектами, включая скорость передачи данных, качество речи, задержку (размер кадра и опережающий просмотр), вычислительную сложность, надежность для различных говорящих и языков, устойчивость к различным фоновым шумам, устойчивость к ошибкам канала, а также восстановление состояния кодека при потере пакетов. Поскольку более низкие скорости MELPe (600 и 1200 бит / с) являются надмножествами скорости 2400 бит / с, сложность алгоритма (например, в MIPS) примерно одинакова для всех скоростей. Более низкие скорости используют увеличенные кадры и опережающий просмотр, а также размер кодовой книги, поэтому они требуют больше памяти.
Права интеллектуальной собственности
Обратите внимание, что MELPe (и / или его производные) подлежат лицензированию IPR от следующих компаний: Инструменты Техаса (Алгоритм / исходный код MELP 2400 бит / с), Microsoft (Транскодер 1200 бит / с), Thales Group (Скорость 600 бит / с) и AT&T (Noise Pre-Processor NPP).
Смотрите также
Рекомендации
- ^ Модель вокодера LPC со смешанным возбуждением для кодирования речи с низкой скоростью передачи, Алан В. МакКри, Томас П. Барнвелл, 1995 в IEEE Trans. Обработка речи и звука (Исходный MELP)
- ^ Аналого-цифровое преобразование голоса с помощью линейного предсказания смешанного возбуждения (MELP) со смешанным возбуждением со скоростью 2400 бит в секунду, Министерство обороны США (MIL_STD-3005, оригинальный MELP)
- ^ ВЗАИМОДЕЙСТВУЮЩИЙ ГОЛОСОВОЙ КОДЕР НАТО 1200 И 2400 БИТ / С, STANAG-4591, NATO
- ^ MELPE VARIATION ДЛЯ УЗКОПОЛОСНОГО ГОЛОСОВОГО КОДЕРА НАТО 600 БИТ / С, STANAG-4591, NATO
- ^ Алан МакКри, «Масштабируемая структура фонетического вокодера, использующая совместное прогнозирующее векторное квантование параметров MELP», в Proc. IEEE Int. Конф. Acoust., Speech, Signal Processing, 2006, стр. I 705–708, Тулуза, Франция