Теорема Карунена – Лоэва - Karhunen–Loève theorem

В теории случайные процессы, то Теорема Карунена – Лоэва (названный в честь Кари Карунен и Мишель Лоэв ), также известный как Теорема Косамби – Карунена – Лоэва.[1][2] представляет собой представление случайного процесса в виде бесконечной линейной комбинации ортогональные функции, аналогично Ряд Фурье представление функции на ограниченном интервале. Преобразование также известно как преобразование Хотеллинга и преобразование собственного вектора и тесно связано с Анализ главных компонентов (PCA) метод, широко используемый при обработке изображений и анализе данных во многих областях.[3]

Стохастические процессы, задаваемые бесконечными рядами такого вида, впервые были рассмотрены Дамодар Дхармананда Косамби.[4][5] Существует много таких расширений случайного процесса: если процесс индексируется по [а, б], любой ортонормированный базис из L2([а, б]) дает его расширение в этой форме. Важность теоремы Карунена – Лоэва заключается в том, что она дает лучший такой базис в том смысле, что минимизирует общую среднеквадратичная ошибка.

В отличие от ряда Фурье, где коэффициенты являются фиксированными числами, а базис разложения состоит из синусоидальные функции (то есть, синус и косинус функций) коэффициенты в теореме Карунена – Лоэва равны случайные переменные и основа расширения зависит от процесса. Фактически, ортогональные базисные функции, используемые в этом представлении, определяются ковариационная функция процесса. Можно подумать, что Преобразование Карунена – Лоэва адаптируется к процессу, чтобы создать наилучшую основу для его расширения.

В случае по центру случайный процесс {Икст}т ∈ [а, б] (по центру средства E[Икст] = 0 для всех т ∈ [а, б]) удовлетворяющие условию технической непрерывности, Икст допускает разложение

куда Zk попарно некоррелированный случайные величины и функции еk - непрерывные действительные функции на [а, б] которые попарно ортогональный в L2([а, б]). Поэтому иногда говорят, что расширение биортогональный поскольку случайные коэффициенты Zk ортогональны в вероятностном пространстве, а детерминированные функции еk ортогональны во временной области. Общий случай процесса Икст то, что не центрировано, может быть возвращено к случаю центрированного процесса, учитывая ИкстE[Икст] который является центрированным процессом.

Более того, если процесс Гауссовский, то случайные величины Zk гауссовы и стохастически независимый. Этот результат обобщает Преобразование Карунена – Лоэва. Важный пример центрированного реального стохастического процесса на [0, 1] это Винеровский процесс; теорема Карунена – Лоэва может быть использована, чтобы дать ей каноническое ортогональное представление. В этом случае разложение состоит из синусоидальных функций.

Вышеупомянутое разложение на некоррелированные случайные величины также известно как Расширение Карунена – Лоэва или же Разложение Карунена – Лоэва. В эмпирический версия (то есть с коэффициентами, вычисленными из выборки) известна как Преобразование Карунена – Лоэва (КЛТ), Анализ главных компонентов, правильное ортогональное разложение (POD), эмпирические ортогональные функции (термин, используемый в метеорология и геофизика ), или Hotelling преобразовать.

Формулировка

С ТKИкс является линейным оператором, имеет смысл поговорить о его собственных значениях λk и собственные функции еk, которые находятся как решение однородной фредгольмовой интегральное уравнение второго рода

Формулировка теоремы

Теорема. Позволять Икст - случайный процесс, интегрируемый с нулевым средним квадратом, определенный в вероятностном пространстве (Ω, F, п) и индексируется на замкнутом и ограниченном интервале [аб], с непрерывной ковариационной функцией KИкс(s, т).

потом KИкс(с, т) это Ядро Мерсера и позволяя еk быть ортонормированным основанием на L2([а, б]) образованный собственными функциями ТKИкс с соответствующими собственными значениями λk, ИКСт допускает следующее представление

где сходимость в L2, униформа в т и

Кроме того, случайные величины Zk имеют нулевое среднее, некоррелированы и имеют дисперсию λk

Заметим, что обобщениями теоремы Мерсера мы можем заменить интервал [а, б] с другими компактными пространствами C и мера Лебега на [а, б] с мерой Бореля с носителем C.

Доказательство

  • Ковариационная функция KИкс удовлетворяет определению ядра Мерсера. К Теорема Мерсера, следовательно, существует множество {λk, еk(т)} собственных значений и собственных функций оператора TKИкс формируя ортонормированный базис L2([а,б]), и KИкс можно выразить как
  • Процесс Икст можно разложить по собственным функциям еk в качестве:
где коэффициенты (случайные величины) Zk даются проекцией Икст на соответствующие собственные функции
  • Затем мы можем вывести
где мы использовали тот факт, что еk являются собственными функциями ТKИкс и ортонормированы.
  • Покажем теперь, что сходимость L2. Позволять
Потом:
который стремится к 0 по теореме Мерсера.

Свойства преобразования Карунена – Лоэва

Частный случай: распределение Гаусса

Поскольку предел в среднем совместно гауссовских случайных величин является совместно гауссовским, а совместно гауссовские случайные (центрированные) переменные являются независимыми тогда и только тогда, когда они ортогональны, мы также можем заключить:

Теорема. Переменные Zя имеют совместное гауссовское распределение и стохастически независимы, если исходный процесс {Икст}т гауссово.

В гауссовском случае, поскольку переменные Zя независимы, можно сказать больше:

почти наверняка.

Преобразование Карунена – Лоэва декоррелирует процесс

Это следствие независимости Zk.

Разложение Карунена – Лоэва минимизирует полную среднеквадратичную ошибку

Во введении мы упоминали, что усеченное разложение Карунена – Лоэва было наилучшим приближением исходного процесса в том смысле, что оно уменьшает общую среднеквадратичную ошибку, возникающую в результате его усечения. Из-за этого свойства часто говорят, что преобразование KL оптимально уплотняет энергию.

Более конкретно, учитывая любой ортонормированный базис {жk} из L2([а, б]), мы можем разложить процесс Икст в качестве:

куда

и мы можем приблизиться Икст конечной суммой

для некоторого целого числа N.

Требовать. Из всех таких приближений KL-приближение - это то, которое минимизирует общую среднеквадратичную ошибку (при условии, что мы расположили собственные значения в порядке убывания).

Объясненная дисперсия

Важное наблюдение: поскольку случайные коэффициенты Zk KL-разложения некоррелированы, Формула Биенайме утверждает, что дисперсия Икст представляет собой просто сумму отклонений отдельных компонентов суммы:

Интеграция более [а, б] и используя ортонормированность еk, получаем, что общая дисперсия процесса составляет:

В частности, общая дисперсия N-усеченное приближение

В результате N-усеченное расширение объясняет

дисперсии; и если мы довольствуемся приближением, которое объясняет, скажем, 95% дисперсии, то нам просто нужно определить такой, что

Расширение Карунена – Лоэва обладает свойством минимальной энтропии представления

Учитывая представление , для некоторого ортонормированного базиса и случайный , мы позволяем , так что . Затем мы можем определить представление энтропия быть . Тогда у нас есть , для всех вариантов . То есть KL-расширение имеет минимальную энтропию представления.

Доказательство:

Обозначим коэффициенты, полученные для базиса в качестве , и для в качестве .

выбирать . Обратите внимание, что поскольку минимизирует среднеквадратичную ошибку, мы имеем

Расширяя правый размер, получаем:

Используя ортонормальность , и расширение в исходя из этого, получаем, что размер правой руки равен:

Мы можем выполнить индивидуальный анализ для , и поэтому перепишем приведенное выше неравенство как:

Вычитая общий первый член и разделив на , получаем, что:

Это означает, что:

Линейные приближения Карунена – Лоэва.

Рассмотрим целый класс сигналов, которые мы хотим приблизить к первому M векторы базиса. Эти сигналы моделируются как реализации случайного вектора Y[п] размера N. Чтобы оптимизировать приближение, мы разрабатываем базис, который минимизирует среднюю ошибку приближения. В этом разделе доказывается, что оптимальные базисы - это базисы Карунена – Лоэва, которые диагонализируют ковариационную матрицу Y. Случайный вектор Y можно разложить по ортогональному базису

следующее:

где каждый

случайная величина. Приближение с первого MN векторов базиса

Из сохранения энергии в ортогональном базисе следует

Эта ошибка связана с ковариацией Y определяется

Для любого вектора Икс[п] мы обозначим через K ковариационный оператор, представленный этой матрицей,

Ошибка ε[M] поэтому является суммой последних NM коэффициенты ковариационного оператора

Оператор ковариации K является эрмитовым и позитивным и поэтому диагонализуется в ортогональном базисе, называемом базисом Карунена – Лоэва. Следующая теорема утверждает, что базис Карунена – Лоэва оптимален для линейных приближений.

Теорема (оптимальность базиса Карунена – Лоэва). Позволять K - ковариационный оператор. Для всех M ≥ 1, ошибка аппроксимации

минимален тогда и только тогда, когда

является базисом Карунена – Лоэва, упорядоченным по убыванию собственных значений.

Нелинейное приближение в базисах

Линейные приближения проецируют сигнал на M векторы априори. Приближение можно сделать более точным, выбрав M ортогональные векторы в зависимости от свойств сигнала. В этом разделе анализируется общая производительность этих нелинейных приближений. Сигнал аппроксимируется M векторов, выбранных адаптивно в ортонормированном базисе для

Позволять - проекция f на M векторов, индексы которых лежат в яM:

Ошибка аппроксимации складывается из оставшихся коэффициентов

Чтобы минимизировать эту ошибку, индексы в яM должны соответствовать M векторам, имеющим наибольшую амплитуду внутреннего произведения

Это векторы, которые лучше всего коррелируют с f. Таким образом, их можно интерпретировать как основные черты f. Результирующая ошибка обязательно меньше, чем ошибка линейного приближения, которое выбирает M векторов приближения независимо от f. Давайте рассортируем

в порядке убывания

Лучшее нелинейное приближение

Его также можно записать как внутренний порог продукта:

с

Нелинейная ошибка равна

эта ошибка быстро стремится к нулю при увеличении M, если отсортированные значения быстро затухают при увеличении k. Этот распад количественно оценивается путем вычисления норма сигнальных скалярных продуктов в B:

Следующая теорема связывает распад ε[M] к

Теорема (убыль ошибки). Если с п < 2 тогда

и

Наоборот, если тогда

для любого q > п.

Неоптимальность базисов Карунена – Лоэва.

Чтобы дополнительно проиллюстрировать различия между линейными и нелинейными приближениями, мы изучаем разложение простого негауссовского случайного вектора в базисе Карунена – Лоэва. Процессы, реализации которых имеют случайную трансляцию, стационарны. Тогда базис Карунена – Лоэва является базисом Фурье, и мы изучаем его эффективность. Чтобы упростить анализ, рассмотрим случайный вектор Y[п] размера N это случайный сдвиг по модулю N детерминированного сигнала ж[п] нулевого среднего

Случайный сдвиг п равномерно распределена на [0,N − 1]:

Четко

и

Следовательно

Поскольку RY N периодичен, Y - круговой стационарный случайный вектор. Оператор ковариации представляет собой круговую свертку с RY и поэтому диагонализуется в дискретном базисе Фурье, Карунена – Лоэва

Спектр мощности представляет собой преобразование Фурье рY:

Пример: Рассмотрим крайний случай, когда . Приведенная выше теорема гарантирует, что базис Фурье, Карунена – Лоэва дает меньшую ожидаемую ошибку аппроксимации, чем канонический базис Дирака. . Действительно, нам априори неизвестна абсцисса ненулевых коэффициентов Y, поэтому не существует конкретного Дирака, лучше приспособленного для выполнения аппроксимации. Но векторы Фурье покрывают всю опору Y и, таким образом, поглощают часть энергии сигнала.

Выбор более высоких частотных коэффициентов Фурье дает лучшее среднеквадратическое приближение, чем выбор априори нескольких векторов Дирака для выполнения аппроксимации. Совершенно иная ситуация для нелинейных приближений. Если тогда дискретный базис Фурье крайне неэффективен, потому что f и, следовательно, Y имеют энергию, которая почти равномерно распределена между всеми векторами Фурье. Напротив, поскольку f имеет только два ненулевых коэффициента в базисе Дирака, нелинейная аппроксимация Y с M ≥ 2 дает нулевую ошибку.[6]

Анализ главных компонентов

Мы установили теорему Карунена – Лоэва и вывели некоторые ее свойства. Мы также отметили, что одним из препятствий при его применении была численная стоимость определения собственных значений и собственных функций его ковариационного оператора с помощью интегрального уравнения Фредгольма второго рода.

Однако применительно к дискретному и конечному процессу , задача принимает гораздо более простой вид, и для выполнения вычислений можно использовать стандартную алгебру.

Обратите внимание, что непрерывный процесс также может быть отобран на N моменты времени, чтобы свести проблему к конечной версии.

В дальнейшем мы рассматриваем случайную N-мерный вектор . Как уже упоминалось выше, Икс может содержать N образцы сигнала, но он может содержать гораздо больше представлений в зависимости от области применения. Например, это могут быть ответы на опрос или экономические данные в эконометрическом анализе.

Как и в непрерывном варианте, мы предполагаем, что Икс центрировано, иначе мы можем позволить (куда это средний вектор из Икс), который центрирован.

Адаптируем процедуру к дискретному случаю.

Ковариационная матрица

Напомним, что основное значение и сложность преобразования KL - это вычисление собственных векторов линейного оператора, связанного с ковариационной функцией, которые задаются решениями интегрального уравнения, написанного выше.

Определите Σ, ковариационную матрицу Икс, как N × N матрица, элементы которой задаются следующим образом:

Переписывая приведенное выше интегральное уравнение в соответствии с дискретным случаем, мы видим, что оно превращается в:

куда является N-мерный вектор.

Таким образом, интегральное уравнение сводится к простой задаче на собственные значения матрицы, что объясняет, почему PCA имеет такую ​​широкую область применения.

Поскольку Σ является положительно определенной симметричной матрицей, она обладает набором ортонормированных собственных векторов, образующих базис , и мы пишем этот набор собственных значений и соответствующих собственных векторов, перечисленных в убывающих значениях λя. Пусть также Φ - ортонормированная матрица, состоящая из этих собственных векторов:

Преобразование главного компонента

Осталось выполнить собственно преобразование KL, называемое преобразование главных компонент в этом случае. Напомним, что преобразование было найдено путем расширения процесса по базису, покрытому собственными векторами ковариационной функции. В этом случае мы имеем:

В более компактной форме преобразование главных компонент Икс определяется:

В я-й компонент Y является , проекция Икс на и обратное преобразование Икс = ΦY дает расширение Икс на пространстве, охваченном :

Как и в непрерывном случае, мы можем уменьшить размерность задачи, усекая сумму на некотором такой, что

где α - объясненный порог дисперсии, который мы хотим установить.

Мы также можем уменьшить размерность за счет использования многоуровневой оценки доминирующего собственного вектора (MDEE).[7]

Примеры

Винеровский процесс

Существует множество эквивалентных характеристик Винеровский процесс что является математической формализацией Броуновское движение. Здесь мы рассматриваем его как центрированный стандартный гауссовский процесс Wт с ковариационной функцией

Мы ограничиваем временную область [а, б] = [0,1] без ограничения общности.

Собственные векторы ядра ковариации легко определяются. Это

а соответствующие собственные значения равны

Это дает следующее представление о винеровском процессе:

Теорема. Есть последовательность {Zя}я независимых гауссовских случайных величин с нулевым средним и дисперсией 1 такой, что

Обратите внимание, что это представление действительно только для На больших интервалах приращения не являются независимыми. Как указано в теореме, сходимость происходит в L2 норма и униформа вт.

Броуновский мост

Аналогичным образом Броуновский мост который является случайный процесс с ковариационной функцией

можно представить как серию

Приложения

Адаптивная оптика системы иногда используют функции K – L для восстановления информации о фазе волнового фронта (Dai 1996, JOSA A). Разложение Кархунена – Лоэва тесно связано с Разложение по сингулярным значениям. Последний имеет множество приложений в области обработки изображений, радаров, сейсмологии и т. Д. Если есть независимые векторные наблюдения от векторнозначного случайного процесса, то левые сингулярные векторы равны максимальная вероятность оценки разложения ансамбля KL.

Приложения для оценки и обнаружения сигналов

Обнаружение известного непрерывного сигнала S(т)

При общении мы обычно должны решить, содержит ли сигнал из зашумленного канала ценную информацию. Следующая проверка гипотез используется для обнаружения непрерывного сигнала. s(т) с выхода канала Икс(т), N(т) - шум канала, который обычно считается гауссовским процессом с нулевым средним с корреляционной функцией

Обнаружение сигнала в белом шуме

Когда шум канала белый, его корреляционная функция

и имеет постоянную плотность спектра мощности. В физически практическом канале мощность шума конечна, поэтому:

Тогда корреляционная функция шума является функцией sinc с нулями при Поскольку они некоррелированы и гауссовы, они независимы. Таким образом, мы можем брать образцы из Икс(т) с интервалом времени

Позволять . У нас в общей сложности i.i.d наблюдения разработать тест отношения правдоподобия. Определить сигнал , проблема становится,

Отношение логарифма правдоподобия

В качестве т → 0, позволять:

потом грамм это статистика теста и Оптимальный детектор Неймана – Пирсона является

В качестве грамм является гауссовым, мы можем охарактеризовать его, найдя его среднее значение и дисперсии. Тогда получаем

куда

- энергия сигнала.

Ошибка ложной тревоги

И вероятность обнаружения:

где Φ - cdf стандартной нормальной или гауссовой переменной.

Обнаружение сигнала в цветном шуме

Когда N (t) окрашен (коррелирован во времени) гауссовский шум с нулевым средним и ковариационной функцией мы не можем сделать выборку независимых дискретных наблюдений, равномерно распределив время. Вместо этого мы можем использовать расширение K – L, чтобы некоррелировать шумовой процесс и получить независимые гауссовские «выборки» наблюдений. K – L разложение N(т):

куда и ортонормированные базы генерируются ядром , т.е. решение

Сделайте расширение:

куда , тогда

под H и под К. Пусть , у нас есть

являются независимыми гауссовскими с.в. с дисперсией
под H: являются независимыми гауссовскими с.в.
под K: являются независимыми гауссовскими с.в.

Следовательно, log-LR определяется как

а оптимальный детектор

Определять

тогда

Как найти k(т)

С

k (t) - решение

Если N(т) стационарен в широком смысле,

который известен как Уравнение Винера – Хопфа. Уравнение может быть решено с помощью преобразования Фурье, но не реализуемо на практике, поскольку бесконечный спектр требует пространственной факторизации. Частный случай, который легко вычислить k(т) - белый гауссовский шум.

Соответствующий импульсный отклик час(т) = k(Т − т) = CS(Т − т). Позволять C = 1, это как раз тот результат, к которому мы пришли в предыдущем разделе для обнаружения сигнала в белом шуме.

Порог тестирования для детектора Неймана – Пирсона

Поскольку X (t) - гауссовский процесс,

- гауссова случайная величина, которую можно охарактеризовать своим средним значением и дисперсией.

Отсюда получаем распределения ЧАС и K:

Ошибка ложной тревоги

Таким образом, порог тестирования оптимального детектора Неймана – Пирсона равен

Его способность обнаружения составляет

Когда шум представляет собой белый гауссовский процесс, мощность сигнала равна

Предварительное отбеливание

Для некоторых типов цветного шума типичной практикой является добавление предварительного отбеливающего фильтра перед согласованным фильтром, чтобы преобразовать цветной шум в белый шум. Например, N (t) - это стационарный цветной шум широкого смысла с корреляционной функцией

Передаточная функция фильтра предварительного отбеливания:

Обнаружение гауссовского случайного сигнала в Аддитивный белый гауссовский шум (AWGN)

Когда сигнал, который мы хотим обнаружить из зашумленного канала, также является случайным, например, белый гауссовский процесс Икс(т), мы все еще можем реализовать расширение K – L, чтобы получить независимую последовательность наблюдений. В этом случае проблема обнаружения описывается следующим образом:

Икс(т) - случайный процесс с корреляционной функцией

K – L разложение Икс(т) является

куда

и решения для

Так представляют собой независимую последовательность случайных величин с нулевым средним и дисперсией . Расширение Y(т) и N(т) к , мы получили

куда

В качестве N(т) - гауссовский белый шум, - это i.i.d последовательность случайных величин с нулевым средним и дисперсией , то задача упрощается следующим образом:

Оптимальный тест Неймана – Пирсона:

поэтому логарифмическое отношение правдоподобия

С

это просто минимальная среднеквадратичная оценка данный s,

K – L разложение обладает следующим свойством: Если

куда

тогда

Так что давайте

Непричинный фильтр Q(т,s) можно использовать для получения оценки через

К принцип ортогональности, Q(т,s) удовлетворяет

Однако по практическим соображениям необходимо дополнительно вывести причинный фильтр. час(т,s), куда час(т,s) = 0 для s > т, чтобы получить оценку . Конкретно,

Смотрите также

Примечания

  1. ^ Сапатнекар, Сачин (2011), «Преодоление вариаций в технологиях нанометрового масштаба», Журнал IEEE по новым и избранным темам в схемах и системах, 1 (1): 5–18, Bibcode:2011IJEST ... 1 .... 5S, CiteSeerX  10.1.1.300.5659, Дои:10.1109 / jetcas.2011.2138250
  2. ^ Гоман, Сатьяджит; Ван, Чжичунь; Чен, ПК; Капания, Ракеш (2012), Схема упрощенного проектирования на основе POD для оптимизации формы летательных аппаратов
  3. ^ Преобразование Карунена – Лоэва (KLT), Лекции по компьютерной обработке и анализу изображений (E161), Колледж Харви Мадда
  4. ^ Раджу, С.К. (2009), «Косамби-математик», Экономический и политический еженедельник, 44 (20): 33–45
  5. ^ Косамби, Д. Д. (1943), "Статистика в функциональном пространстве", Журнал Индийского математического общества, 7: 76–88, МИСТЕР  0009816.
  6. ^ Вейвлет-тур по обработке сигналов - Стефан Малла
  7. ^ X. Tang, «Информация о текстуре в матрицах длин серий», IEEE Transactions on Image Processing, vol. 7, No. 11, pp. 1602–1609, ноябрь 1998 г.

Рекомендации

  • Старк, Генри; Вудс, Джон В. (1986). Вероятность, случайные процессы и теория оценок для инженеров. Prentice-Hall, Inc. ISBN  978-0-13-711706-2. ПР  21138080M.
  • Ганем, Роджер; Спанос, Поль (1991). Стохастические конечные элементы: спектральный подход. Springer-Verlag. ISBN  978-0-387-97456-9. ПР  1865197M.
  • Guikhman, I .; Скороход, А. (1977). Введение a la Théorie des Processus Aléatoires. Издания МИР.
  • Саймон Б. (1979). Функциональная интеграция и квантовая физика. Академическая пресса.
  • Карунен, Кари (1947). "Über lineare Methoden in der Wahrscheinlichkeitsrechnung". Анна. Акад. Sci. Fennicae. Сер. А. И. Матем.-физ.. 37: 1–79.
  • Лоэв, М. (1978). Теория вероятности. Vol. II, 4-е изд.. Тексты для выпускников по математике. 46. Springer-Verlag. ISBN  978-0-387-90262-3.
  • Дай, Г. (1996). «Модальная реконструкция волнового фронта с помощью многочленов Цернике и функций Карунена – Лоэва». JOSA A. 13 (6): 1218. Bibcode:1996JOSAA..13.1218D. Дои:10.1364 / JOSAA.13.001218.
  • Ву Б., Чжу Дж., Наджм Ф. (2005) "Непараметрический подход для оценки динамического диапазона нелинейных систем". В материалах конференции по автоматизации проектирования (841-844) 2005 г.
  • Ву Б., Чжу Дж., Наджм Ф. (2006) «Оценка динамического диапазона». IEEE Transactions по автоматизированному проектированию интегральных схем и систем, Vol. 25 Выпуск: 9 (1618–1636) 2006 г.
  • Jorgensen, Palle E.T .; Песня, Мён-Син (2007). «Энтропийное кодирование, гильбертово пространство и преобразования Карунена – Лоэва». Журнал математической физики. 48 (10): 103503. arXiv:math-ph / 0701056. Bibcode:2007JMP .... 48j3503J. Дои:10.1063/1.2793569.

внешняя ссылка