Обнаружение шагов - Step detection

Примеры сигналов, которые могут содержать шаги, искаженные шумом. (а) Соотношение числа копий ДНК из микрочип данные, (б) космический луч интенсивность от нейтронный монитор, (в) скорость вращения от времени Р. Сфероидес жгутиковый мотор и (d) интенсивность красного пикселя из одной строки развертки цифрового изображения.

В статистика и обработка сигналов, обнаружение шагов (также известный как ступенчатое сглаживание, пошаговая фильтрация, обнаружение сдвига, обнаружение прыжка или же обнаружение края) - это процесс обнаружения резких изменений (шагов, скачков, сдвигов) среднего уровня Временные ряды или сигнал. Обычно это рассматривается как частный случай статистического метода, известного как обнаружение изменений или изменение точки обнаружения. Часто шаг небольшой, а временной ряд искажается какой-то шум, и это усложняет задачу, поскольку ступенька может быть скрыта шумом. Поэтому часто требуются статистические алгоритмы и / или алгоритмы обработки сигналов.

Проблема обнаружения шагов возникает во многих научных и инженерных контекстах, например, в Статистическое управление процессами[1]контрольная диаграмма являясь наиболее непосредственно связанным методом), в исследовании геофизика (где проблема состоит в том, чтобы сегментировать каротаж запись в стратиграфические зоны[2]), в генетика (проблема разделения микрочип данные в аналогичные номер копии режимы[3]), И в биофизика (обнаружение переходов состояний в молекулярная машина как записано в графиках времени[4]). Для 2D сигналов связанная проблема обнаружение края интенсивно изучается для обработка изображений.[5]

Алгоритмы

Если необходимо выполнить обнаружение шага по мере поступления данных, тогда онлайн-алгоритмы обычно используются,[6] и это становится частным случаем последовательный анализ К таким алгоритмам относятся классические CUSUM метод, применяемый к изменениям среднего.[7]

Напротив, не в сети алгоритмы применяются к данным потенциально спустя долгое время после их получения. Большинство автономных алгоритмов обнаружения шагов в цифровых данных можно отнести к категории сверху вниз, вверх дном, раздвижное окно, или же Глобальный методы.

Сверху вниз

Эти алгоритмы начинаются с предположения об отсутствии шагов и вводят возможные шаги-кандидаты по одному, проверяя каждого кандидата, чтобы найти тот, который минимизирует некоторые критерии (например, аппроксимацию методом наименьших квадратов оцененного базового кусочно-постоянного сигнала). Примером может служить ступенчатое размещение прыжка алгоритм, впервые изученный в геофизических задачах,[2] который недавно нашел применение в современной биофизике.[8]

Вверх дном

Алгоритмы «снизу вверх» используют «противоположный» подход к методам «сверху вниз», сначала предполагая, что есть шаг между каждой выборкой в ​​цифровом сигнале, а затем последовательные шаги слияния на основе некоторых критериев, проверенных для каждого слияния кандидатов.

Раздвижное окно

Рассматривая небольшое «окно» сигнала, эти алгоритмы ищут свидетельства того, что в этом окне происходит шаг. Окно «скользит» по временному ряду, шаг за шагом. Доказательства шага проверяются статистическими процедурами, например, с использованием двухвыборочного метода. T-тест Стьюдента. В качестве альтернативы нелинейный фильтр такой как медианный фильтр применяется к сигналу. Подобные фильтры пытаются убрать шум, сохраняя резкие шаги.

Глобальный

Глобальные алгоритмы рассматривают весь сигнал за один раз и пытаются найти шаги в сигнале с помощью какой-либо процедуры оптимизации. Алгоритмы включают вейвлет методы,[9] и полное изменение шумоподавления который использует методы из выпуклая оптимизация. Где ступеньки можно смоделировать как Цепь Маркова, тогда Скрытые марковские модели также часто используются (популярный подход в сообществе биофизиков[10]). Когда есть только несколько уникальных значений среднего, тогда k-означает кластеризацию также можно использовать.

Сравнение линейных и нелинейных методов обработки сигналов для обнаружения ступенек

Поскольку ступеньки и (независимый) шум теоретически бесконечны пропускная способность и так пересекаются в Базис Фурье, обработка сигналов подходы к обнаружению ступенек обычно не используют классические методы сглаживания, такие как фильтр нижних частот. Вместо этого большинство алгоритмов явно нелинейны или изменяются во времени.[11]

Обнаружение ступеней и кусочно-постоянные сигналы

Поскольку цель обнаружения ступенек - найти серию мгновенных скачков среднего значения сигнала, желаемый, лежащий в основе, средний сигнал равен кусочно-постоянная. По этой причине обнаружение ступенек можно с успехом рассматривать как задачу восстановления кусочно-постоянного сигнала, искаженного шумом. Есть две дополнительные модели для кусочно-постоянных сигналов: as Шлицы 0 градусов с несколькими узлами, или как наборы уровней с несколькими уникальными уровнями. Поэтому многие алгоритмы обнаружения ступенек лучше всего понимать как методы подгонки сплайнов с нулевым градусом или как методы восстановления набора уровней.

Обнаружение шага при восстановлении установленного уровня

Когда есть только несколько уникальных значений среднего, методы кластеризации, такие как k-означает кластеризацию или же средний сдвиг уместны. Эти методы лучше всего понимать как методы поиска описания набора уровней лежащего в основе кусочно-постоянного сигнала.

Обнаружение ступенек при подгонке шлицев под 0 градусов

Многие алгоритмы явно подгоняют сплайны с углом 0 градусов к зашумленному сигналу, чтобы обнаружить шаги (включая методы пошагового размещения скачков[2][8]), но есть и другие популярные алгоритмы, которые также можно рассматривать как методы подгонки сплайнов после некоторого преобразования, например полное изменение шумоподавления.[12]

Обобщенное обнаружение ступенек с помощью кусочно-постоянного шумоподавления

Все упомянутые выше алгоритмы имеют определенные преимущества и недостатки в определенных обстоятельствах, однако удивительно большое количество этих алгоритмов обнаружения шагов являются частными случаями более общего алгоритма.[11] Этот алгоритм предполагает минимизацию глобального функционала:[13]

 

 

 

 

(1)

Здесь, Икся за я = 1, ...., N дискретный входной сигнал длины N, и мя - выходной сигнал алгоритма. Цель - минимизировать ЧАС[м] относительно выходного сигналам. Форма функции определяет конкретный алгоритм. Например, выбрав:

куда я(S) = 0, если условие S ложно, иначе получается полное изменение шумоподавления алгоритм с параметром регуляризации . По аналогии:

приводит к средний сдвиг алгоритм, при использовании интегратора Эйлера адаптивного размера шага, инициализированного входным сигналомИкс.[13] Здесь W > 0 - параметр, определяющий поддержку ядра среднего сдвига. Другой пример:

ведущий к двусторонний фильтр, куда - параметр тонального ядра, а W это поддержка пространственного ядра. Еще один особый случай:

определение группы алгоритмов, которые пытаются жадно подогнать сплайны 0 градусов к сигналу.[2][8] Здесь, определяется как ноль, если Икс = 0, иначе единица.

Многие функционалы в уравнении (1) определяется частным выбором находятся выпуклый: их можно минимизировать с помощью методов из выпуклая оптимизация. Третьи не являются выпуклыми, но был разработан ряд алгоритмов для минимизации этих функционалов.[13]

Обнаружение ступенек с использованием модели Поттса

Классическим вариационным методом обнаружения ступенек является модель Поттса. Он задается невыпуклой задачей оптимизации

Период, термин штрафует количество прыжков и срок измеряет верность данным Икс. Параметр γ> 0 контролирует компромисс между регулярностью и точностью данных. Поскольку минимизатор кусочно постоянна, шаги задаются ненулевыми положениями градиента .За и есть быстрые алгоритмы, которые дают точное решение проблемы Поттса в . [14][15][16][17]

Смотрите также

Рекомендации

  1. ^ E.S. Пейдж (1955). «Тест на изменение параметра, происходящее в неизвестной точке». Биометрика. 42 (3–4): 523–527. Дои:10.1093 / biomet / 42.3-4.523. HDL:10338.dmlcz / 103435.
  2. ^ а б c d Гилл, Д. (1970). «Применение метода статистического зонирования для оценки коллектора и анализа оцифрованного каротажа». Бюллетень Американской ассоциации геологов-нефтяников. 54: 719–729. Дои:10.1306 / 5d25ca35-16c1-11d7-8645000102c1865d.
  3. ^ Snijders, A.M .; и другие. (2001). «Сборка микрочипов для измерения количества копий ДНК в масштабе всего генома». Природа Генетика. 29 (3): 263–264. Дои:10,1038 / ng754. PMID  11687795.
  4. ^ Sowa, Y .; Rowe, A.D .; Лик, М. С .; Якуши, Т .; Homma, M .; Ishijima, A .; Берри, Р. М. (2005). «Непосредственное наблюдение за шагами вращения жгутикового мотора бактерий». Природа. 437 (7060): 916–919. Bibcode:2005Натура.437..916С. Дои:10.1038 / nature04003. PMID  16208378.
  5. ^ Серра, Дж. П. (1982). Анализ изображений и математическая морфология. Лондон; Нью-Йорк: Academic Press.
  6. ^ Basseville, M .; И.В. Никифорова (1993). Обнаружение резких изменений: теория и применение. Прентис Холл.
  7. ^ Родионов С.Н., 2005а: Краткий обзор методов обнаружения смены режима. ссылка на PDF В: Крупномасштабные нарушения (смены режимов) и восстановление в водных экосистемах: проблемы управления в целях обеспечения устойчивости, В. Великова и Н. Чипев (ред.), Семинар ЮНЕСКО-РОСТЕ / БАС по смене режимов, 14–16 июня 2005 г., Варна, Болгария, 17-24.
  8. ^ а б c Kerssemakers, J.W.J .; Munteanu, E.L .; Laan, L .; Noetzel, T.L .; Janson, M.E .; Догтером, М. (2006). «Динамика сборки микротрубочек при молекулярном разрешении». Природа. 442 (7103): 709–712. Bibcode:2006Натура 442..709К. Дои:10.1038 / природа04928. PMID  16799566.
  9. ^ Маллат, S .; Хван, W.L. (1992). «Обнаружение и обработка сингулярностей с помощью вейвлетов». IEEE Transactions по теории информации. 38 (2): 617–643. CiteSeerX  10.1.1.36.5153. Дои:10.1109/18.119727.
  10. ^ McKinney, S.A .; Джу, С .; Ха, Т. (2006). "Анализ траекторий FRET одиночных молекул с помощью скрытого марковского моделирования". Биофизический журнал. 91 (5): 1941–1951. Дои:10.1529 / biophysj.106.082487. ЧВК  1544307. PMID  16766620.
  11. ^ а б Литтл, M.A .; Джонс, Н. (2011). «Обобщенные методы и решатели для удаления шума из кусочно-постоянных сигналов: Часть I. Предпосылки теории». Труды Королевского общества А. 467 (2135): 3088–3114. Bibcode:2011RSPSA.467.3088L. Дои:10.1098 / rspa.2010.0671. ЧВК  3191861. PMID  22003312.
  12. ^ Chan, D .; Т. Чан (2003). «Сохраняющие край и зависящие от масштаба свойства регуляризации полной вариации». Обратные задачи. 19 (6): S165 – S187. Bibcode:2003ИнвПр..19С.165С. Дои:10.1088/0266-5611/19/6/059.
  13. ^ а б c Mrazek, P .; Weickert, J .; Брун, А. (2006). «О робастном оценивании и сглаживании с пространственным и тональным ядрами». Геометрические свойства для неполных данных. Берлин, Германия: Springer.
  14. ^ Мамфорд Д. и Шах Дж. (1989). Оптимальные приближения кусочно гладкими функциями и связанные с ними вариационные задачи. Сообщения по чистой и прикладной математике, 42 (5), 577-685.
  15. ^ Winkler, G .; Либшер, В. (2002). «Сглаживающие устройства для прерывистых сигналов». Журнал непараметрической статистики. 14 (1–2): 203–222. Дои:10.1080/10485250211388.
  16. ^ Фридрих; и другие. (2008). «М-оценка со штрафом за сложность: быстрое вычисление». Журнал вычислительной и графической статистики. 17 (1): 201–224. Дои:10.1198 / 106186008x285591.
  17. ^ А. Вайнманн, М. Сторат, Л. Демарет. "The - Функционал Поттса для надежной реконструкции с разреженными скачками. "SIAM Journal on Numerical Analysis, 53 (1): 644-673 (2015).

внешняя ссылка