Оценка ковариационных матриц - Estimation of covariance matrices

В статистика, иногда ковариационная матрица из многомерная случайная величина не известно, но должно быть по оценкам. Оценка ковариационных матриц затем рассматривается вопрос о том, как аппроксимировать фактическую ковариационную матрицу на основе выборки из многомерное распределение. Простые случаи, когда наблюдения полны, могут быть обработаны с помощью выборочная ковариационная матрица. Выборочная ковариационная матрица (SCM) представляет собой беспристрастный и эффективный оценщик ковариационной матрицы, если пространство ковариационных матриц рассматривается как внешний выпуклый конус в рп×п; однако, измеренный с использованием внутренняя геометрия из положительно определенные матрицы, SCM - это пристрастный и неэффективный оценщик.[1] Кроме того, если случайная величина имеет нормальное распределение, выборочная матрица ковариаций имеет Распределение Уишарта и его версия с немного другим масштабом оценка максимального правдоподобия. Дела с участием отсутствующие данные требуют более глубокого рассмотрения. Другой вопрос - это надежность к выбросы, к которым высокочувствительны выборочные ковариационные матрицы.[2][3][4]

Статистический анализ многомерных данных часто включает исследовательские исследования того, как переменные изменяются по отношению друг к другу, и за этим могут следовать явные статистические модели, включающие ковариационную матрицу переменных. Таким образом, оценка ковариационных матриц непосредственно по данным наблюдений играет две роли:

  • предоставить начальные оценки, которые можно использовать для изучения взаимосвязей;
  • для предоставления выборочных оценок, которые можно использовать для проверки модели.

Оценки ковариационных матриц требуются на начальных этапах Анализ главных компонентов и факторный анализ, а также участвуют в версиях регрессивный анализ которые относятся к зависимые переменные в наборе данных, совместно с независимая переменная как результат случайной выборки.

Оценка в общем контексте

Учитывая образец состоящий из п независимые наблюдения Икс1,..., Иксп из п-размерный случайный вектор Иксрп×1п× 1 вектор-столбец), беспристрастный оценщик из (п×п) ковариационная матрица

это выборочная ковариационная матрица

куда это я-е наблюдение п-мерный случайный вектор, а вектор

это выборочное среднее Это верно независимо от распределения случайной величины. Икспри условии, конечно, что теоретические средства и ковариации существуют. Причина фактора п - 1, а не п по сути та же, что и причина того же фактора, появляющегося в несмещенных оценках выборочные отклонения и выборочные ковариации, что связано с тем, что среднее значение неизвестно и заменяется выборочным средним (см. Поправка Бесселя ).

В тех случаях, когда распределение случайная переменная Икс известно, что он находится в пределах определенного семейства распределений, другие оценки могут быть получены на основе этого предположения. Известен случай, когда случайная переменная Икс является нормально распределенный: в этом случае максимальная вероятность оценщик ковариационной матрицы немного отличается от несмещенной оценки и определяется выражением

Вывод этого результата приводится ниже. Ясно, что разница между несмещенной оценкой и оценкой максимального правдоподобия уменьшается для больших п.

В общем случае несмещенная оценка ковариационной матрицы обеспечивает приемлемую оценку, когда все векторы данных в наблюдаемом наборе данных полны: то есть они не содержат недостающие элементы. Один из подходов к оценке ковариационной матрицы состоит в том, чтобы обрабатывать оценку каждой дисперсии или попарной ковариации отдельно и использовать все наблюдения, для которых обе переменные имеют допустимые значения. Предполагая, что недостающие данные отсутствует наугад это приводит к несмещенной оценке ковариационной матрицы. Однако для многих приложений эта оценка может оказаться неприемлемой, поскольку не гарантируется, что оцененная матрица ковариации будет положительной полуопределенной. Это может привести к предполагаемым корреляциям, имеющим абсолютные значения больше единицы, и / или к необратимой ковариационной матрице.

При оценке кросс-ковариация пары сигналов, которые стационарный в широком смысле, недостающие образцы делают нет должны быть случайными (например, допустима подвыборка по произвольному коэффициенту).[нужна цитата ]

Оценка максимального правдоподобия для многомерного нормального распределения

Случайный вектор Иксрпп× 1 «вектор-столбец») имеет многомерное нормальное распределение с невырожденной ковариационной матрицей Σ в точности, если Σ ∈ рп × п это положительно определенная матрица и функция плотности вероятности из Икс является

куда μрп×1 это ожидаемое значение из Икс. В ковариационная матрица Σ - многомерный аналог того, что в одном измерении было бы отклонение, и

нормализует плотность так что он интегрируется в 1.

Предположим теперь, что Икс1, ..., Иксп находятся независимый и идентично распределенные образцы из приведенного выше распределения. На основе наблюдаемые значения Икс1, ..., Иксп этого образец, мы хотим оценить Σ.

Первые шаги

Функция правдоподобия:

Достаточно легко показать, что максимальная вероятность оценка среднего вектора μ это "выборочное среднее "вектор:

Видеть раздел об оценке в статье о нормальном распределении для подробностей; здесь процесс аналогичен.

Поскольку оценка не зависит от Σ, мы можем просто заменить его на μ в функция правдоподобия, получающий

а затем найдите значение Σ, которое максимизирует вероятность данных (на практике легче работать с журналом).

След матрицы 1 × 1

Теперь мы подошли к первому удивительному шагу: рассмотрим скаляр как след матрицы 1 × 1. Это дает возможность использовать тождество tr (AB) = tr (BA) в любое время А и B матрицы имеют такую ​​форму, что существуют оба продукта. Мы получили

куда

иногда называют матрица рассеяния, и положительно определен, если существует подмножество данных, состоящее из аффинно независимые наблюдения (которые мы будем предполагать).

Используя спектральную теорему

Это следует из спектральная теорема из линейная алгебра что положительно определенная симметричная матрица S имеет единственный положительно определенный симметричный квадратный корень S1/2. Мы снова можем использовать «циклическое свойство» следа писать

Позволять B = S1/2 Σ −1 S1/2. Тогда выражение выше становится

Положительно определенная матрица B можно диагонализовать, и тогда проблема нахождения значения B что максимизирует

Поскольку след квадратной матрицы равен сумме собственных значений ("след и собственные значения" ) уравнение сводится к задаче нахождения собственных значений λ1, ..., λп что максимизировать

Это просто задача исчисления, и мы получаем λя = п для всех я. Итак, предположим Q - матрица собственных векторов, то

т.е. п раз п×п единичная матрица.

Заключительные шаги

В итоге получаем

т.е. п×п "образец ковариационной матрицы"

является оценкой максимального правдоподобия «матрицы ковариации населения» Σ. На данный момент мы используем заглавную Икс а не строчные Икс потому что мы думаем об этом «скорее как об оценке, чем как об оценке», то есть как о чем-то случайном, распределение вероятностей которого мы могли бы получить, зная. Матрица случайных чисел S можно показать, что Распределение Уишарта с п - 1 степень свободы.[5] То есть:

Альтернативное происхождение

Альтернативный вывод оценки максимального правдоподобия может быть выполнен с помощью матричное исчисление формулы (см. также дифференциал определителя и дифференциал обратной матрицы ). Он также проверяет вышеупомянутый факт об оценке максимального правдоподобия среднего. Перепишите вероятность в форму журнала, используя трюк трассировки:

Дифференциал этого логарифмического правдоподобия равен

Естественно, он подразделяется на часть, связанную с оценкой среднего, и на часть, связанную с оценкой дисперсии. В условие первого порядка для максимума, , выполняется, когда слагаемые при умножении и тождественно равны нулю. Предполагая (оценка максимального правдоподобия) неособо, условие первого порядка оценки среднего вектора имеет вид

что приводит к оценке максимального правдоподобия

Это позволяет нам упростить

как определено выше. Тогда условия, включающие в можно объединить как

Условие первого порядка будет выполняться, когда член в квадратных скобках равен (с матричным) нулевым значением. Предварительно умножая последнее на и деление на дает

что, конечно, совпадает с каноническим выводом, данным ранее.

Дуайер [6] указывает, что разложение на два члена, как показано выше, является «ненужным», и выводит оценщик за две линии работы. Обратите внимание, что может быть нетривиальной задачей показать, что такая производная оценка является уникальным глобальным максимизатором для функции правдоподобия.

Оценка внутренней ковариационной матрицы

Внутреннее ожидание

Учитывая образец из п независимые наблюдения Икс1,..., Иксп из п-мерная гауссовская случайная величина с нулевым средним Икс с ковариацией р, то максимальная вероятность оценщик из р дан кем-то

Параметр р принадлежит к множеству положительно определенные матрицы, что является Риманово многообразие, а не векторное пространство, следовательно, обычные понятия векторного пространства ожидание, то есть "E [р^] ", и систематическая ошибка оценки должны быть обобщены на многообразия, чтобы понять проблему оценки ковариационной матрицы. Это можно сделать, определив математическое ожидание многозначной оценки р^ относительно многозначной точки р в качестве

куда

являются экспоненциальная карта и обратное экспоненциальное отображение, соответственно, "exp" и "log" обозначают обычные матричная экспонента и матричный логарифм, а E [·] - обычный оператор математического ожидания, определенный в векторном пространстве, в данном случае оператор касательное пространство коллектора.[1]

Смещение выборочной ковариационной матрицы

В внутренняя предвзятость векторное поле оценщика SCM определяется как

Внутреннее смещение оценки тогда дается выражением .

За сложный Гауссовские случайные величины, это векторное поле смещения можно показать[1] в равной

куда

а ψ (·) - функция дигаммы. Внутреннее смещение выборочной ковариационной матрицы равно

и SCM асимптотически несмещен как п → ∞.

Точно так же внутренняя неэффективность выборочной ковариационной матрицы зависит от Риманова кривизна пространства положительно определенных матриц.

Оценка усадки

Если размер выборки п невелико и количество рассматриваемых переменных п большой, вышеупомянутые эмпирические оценки ковариации и корреляции очень нестабильны. В частности, можно предоставить оценки, которые значительно улучшают оценку максимального правдоподобия с точки зрения среднеквадратичной ошибки. Более того, для п < п (количество наблюдений меньше количества случайных величин) эмпирическая оценка ковариационной матрицы принимает вид единственное число, т.е. его нельзя инвертировать для вычисления матрица точности.

В качестве альтернативы было предложено множество методов для улучшения оценки ковариационной матрицы. Все эти подходы основаны на концепции усадки. Это подразумевается в Байесовские методы и в штрафных максимальная вероятность методы и явные в Метод усадки Штейна.

Простая версия оценки усадки ковариационной матрицы представлена ​​оценкой усадки Ледуа-Вольфа.[7][8][9][10] Считается выпуклое сочетание эмпирической оценки () с некоторой подходящей выбранной целью (), например диагональная матрица. Впоследствии параметр смешивания () выбран, чтобы максимизировать ожидаемую точность уменьшенной оценки. Это можно сделать перекрестная проверка, или используя аналитическую оценку интенсивности усадки. Полученная регуляризованная оценка () можно показать, что она превосходит оценку максимального правдоподобия для небольших выборок. Для больших образцов интенсивность усадки снизится до нуля, следовательно, в этом случае оценка усадки будет идентична эмпирической оценке. Помимо повышенной эффективности оценка усадки имеет дополнительное преимущество в том, что она всегда является положительно определенной и хорошо обусловленной.

Были предложены различные цели усадки:

  1. то единичная матрица, масштабированный по среднему выборочная дисперсия;
  2. то одноиндексная модель;
  3. модель постоянной корреляции, в которой дисперсии выборки сохраняются, но все попарно коэффициенты корреляции считаются равными друг другу;
  4. двухпараметрическая матрица, где все дисперсии идентичны, и все ковариации идентичны друг другу (хотя нет идентичны дисперсиям);
  5. то диагональная матрица содержащие выборочные дисперсии по диагонали и нули везде;
  6. то единичная матрица.[8]

Оценщик усадки может быть обобщен для многоцелевого оценщика усадки, который использует несколько мишеней одновременно.[11] Программное обеспечение для вычисления оценки ковариационной усадки доступно в р (пакеты корпкор[12] и ShrinkCovMat[13]), в Python (библиотека scikit-learn ), И в MATLAB.[14]

Ближайшая допустимая матрица

В некоторых приложениях (например, при построении моделей данных только на основе частично наблюдаемых данных) нужно найти «ближайшую» ковариационную матрицу или корреляционную матрицу к заданной симметричной матрице (например, наблюдаемых ковариаций). В 2002 году Хайэм[15] формализовали понятие близости с помощью взвешенного Норма Фробениуса и предоставил способ вычисления ближайшей корреляционной матрицы.

Смотрите также

Рекомендации

  1. ^ а б c Смит, Стивен Томас (май 2005 г.). "Ковариация, подпространство и внутренние границы Крамера – Рао". IEEE Trans. Сигнальный процесс. 53 (5): 1610–1630. Дои:10.1109 / TSP.2005.845428. S2CID  2751194.
  2. ^ Надежная статистика, Питер Дж. Хубер, Wiley, 1981 (переиздано в мягкой обложке, 2004)
  3. ^ «Современная прикладная статистика с S», Уильям Н. Венейблс, Брайан Д. Рипли, Springer, 2002 г., ISBN  0-387-95457-0, ISBN  978-0-387-95457-8, стр. 336
  4. ^ Девлин, Сьюзан Дж.; Gnanadesikan, R .; Кеттенринг, Дж. Р. (1975).«Робастная оценка и обнаружение выбросов с помощью коэффициентов корреляции». Биометрика. 62 (3): 531–545. Дои:10.1093 / biomet / 62.3.531.
  5. ^ К.В. Мардия, J.T. Кент, и Дж. М. Бибби (1979) Многомерный анализ, Академическая пресса.
  6. ^ Дуайер, Пол С. (июнь 1967). «Некоторые приложения матричных производных в многомерном анализе». Журнал Американской статистической ассоциации. 62 (318): 607–625. Дои:10.2307/2283988. JSTOR  2283988.
  7. ^ О. Ледуа и М. Вольф (2004a) »Хорошо обусловленная оценка для ковариационных матриц большой размерности В архиве 2014-12-05 в Wayback Machine " Журнал многомерного анализа 88 (2): 365—411.
  8. ^ а б А. Тулумис (2015) "Непараметрические методы оценки ковариационной матрицы усадки типа Стейна в параметрах большой размерности " Вычислительная статистика и анализ данных 83: 251—261.
  9. ^ О. Ледуа и М. Вольф (2003) »Улучшенная оценка ковариационной матрицы доходности акций с приложением для выбора портфолио В архиве 2014-12-05 в Wayback Machine " Журнал эмпирических финансов 10 (5): 603—621.
  10. ^ О. Ледуа и М. Вольф (2004b) »Дорогая, я сжал образец ковариационной матрицы В архиве 2014-12-05 в Wayback Machine " Журнал управления портфелем 30 (4): 110—119.
  11. ^ Т. Ланцевицки и М. Аладжем (2014) "Оценка многоцелевой усадки для ковариационных матриц ", Транзакции IEEE при обработке сигналов, Том: 62, выпуск 24, страницы: 6380-6390.
  12. ^ corpcor: Эффективная оценка ковариации и (частичной) корреляции, CRAN
  13. ^ ShrinkCovMat: Матрицы оценки ковариации усадки, CRAN
  14. ^ Код MATLAB для целей усадки: масштабная идентичность, одноиндексная модель, модель постоянной корреляции, двухпараметрическая матрица, и диагональная матрица.
  15. ^ Хайэм, Николас Дж. (2002). «Вычисление ближайшей корреляционной матрицы - задача из финансов». Журнал численного анализа IMA. 22 (3): 329–343. CiteSeerX  10.1.1.661.2180. Дои:10.1093 / imanum / 22.3.329.