Спектральная плоскостность - Spectral flatness

Максимальная спектральная равномерность (приближающаяся к 1) достигается за счет белого шума.

Спектральная плоскостность или же коэффициент тональности,[1][2] также известен как Винеровская энтропия,[3][4] это мера, используемая в цифровая обработка сигналов охарактеризовать аудио спектр. Спектральная плоскостность обычно измеряется в децибелы, и дает возможность количественно оценить, как тон -как звук, а не быть шум -подобно.[2]

Значение тональный в данном контексте имеется в виду количество пиков или резонансной структуры в спектр мощности, в отличие от плоского спектра белый шум. Высокая спектральная равномерность (приближающаяся к 1,0 для белого шума) указывает на то, что спектр имеет одинаковую мощность во всех спектральных диапазонах - это будет звучать аналогично белому шуму, а график спектра будет выглядеть относительно плоским и гладким. Низкая спектральная однородность (приближающаяся к 0,0 для чистого тона) указывает на то, что спектральная мощность сосредоточена в относительно небольшом количестве полос - обычно это звучит как смесь синусоидальные волны, и спектр будет казаться «колючим».[5]

Спектральная плоскостность вычисляется путем деления среднее геометрическое спектра мощности среднее арифметическое спектра мощности, то есть:

куда х (п) представляет собой величину номер корзины п. Обратите внимание, что один (или несколько) пустых бункеров дает плоскостность 0, поэтому эта мера наиболее полезна, когда бункеры обычно не пусты.

Отношение, полученное в результате этого расчета, часто преобразуется в децибел шкала для отчетов, максимум 0 дБ и минимум –∞ дБ.

Спектральную равномерность также можно измерить в пределах определенного поддиапазона, а не по всему диапазону. Дубнов [2] показал, что спектральная плоскостность эквивалентна теоретико-информационному понятию взаимная информация это известно как двойная полная корреляция.

Приложения

Это измерение является одним из многих звуковых дескрипторов, используемых в MPEG-7 стандарт, в котором он помечен как «AudioSpectralFlatness».

В пение птиц исследования, он использовался как одна из характеристик, измеренных на звуке пения птиц при проверке сходства между двумя отрывками.[6]

Рекомендации

  1. ^ Дж. Д. Джонстон (1988). «Преобразование кодирования аудиосигналов с использованием критериев воспринимаемого шума». Журнал IEEE по избранным областям коммуникаций. 6 (2): 314–332. Дои:10.1109/49.608.
  2. ^ а б c Шломо Дубнов (2004). «Обобщение меры спектральной плоскостности для негауссовских линейных процессов». Письма об обработке сигналов. 11 (8): 698–701. Дои:10.1109 / LSP.2004.831663. ISSN  1070-9908.
  3. ^ Особенности песни ›Энтропия Винера «определяется как отношение среднего геометрического к среднему арифметическому спектра»
  4. ^ Параметры люцинии «Энтропия Винера - альтернативная мера зашумленности сигнала. Она определяется как отношение среднего геометрического к среднему арифметическому для спектра мощности».
  5. ^ Большой набор звуковых функций для звукового описания - технический отчет, опубликованный IRCAM в 2003 г. Раздел 9.1
  6. ^ Черниховский, О., Ноттебом, Ф., Хо, К. Э., Песаран, Б., Митра, П. П., 2000. Процедура автоматического измерения сходства песен. Поведение животных 59 (6), 1167–1176, Дои:10.1006 / anbe.1999.1416.