Ковариация и корреляция - Covariance and correlation

В теория вероятности и статистика, математические концепции ковариация и корреляция очень похожи.[1][2] Оба описывают степень, в которой два случайные переменные или же наборы случайных величин склонны отклоняться от своих ожидаемые значения аналогичным образом.

Если Икс и Y две случайные величины, причем средства (ожидаемые значения) μИкс и μY и стандартные отклонения σИкс и σYсоответственно, то их ковариация и корреляция следующие:

ковариация
корреляция,

так что

куда E - оператор ожидаемого значения. Примечательно, что корреляция безразмерный в то время как ковариация выражается в единицах, полученных путем умножения единиц двух переменных.

Если Y всегда принимает те же значения, что и Икс, у нас есть ковариация переменной с самой собой (т.е. ), который называется отклонение и чаще обозначается как площадь стандартное отклонение. В корреляция переменной с самой собой всегда равно 1 (кроме вырожденный случай где две дисперсии равны нулю, потому что Икс всегда принимает одно и то же единственное значение, и в этом случае корреляция не существует, так как ее вычисление будет включать деление на 0 ). В более общем смысле, корреляция между двумя переменными равна 1 (или –1), если одна из них всегда принимает значение, которое точно задается линейная функция другого с соответственно положительным (или отрицательным) склон.

Хотя значения теоретических ковариаций и корреляций связаны указанным выше образом, распределения вероятностей выборочные оценки эти количества никак не связаны между собой, и их обычно нужно рассматривать отдельно.

Несколько случайных величин

При любом количестве случайных величин, превышающем 1, переменные могут быть объединены в случайный вектор чей я th элемент - это я th случайная переменная. Тогда дисперсии и ковариации можно поместить в ковариационная матрица, в которой (я, j) элемент является ковариацией между я th случайная величина и j th один. Точно так же корреляции могут быть помещены в корреляционная матрица.

Анализ временных рядов

В случае Временные ряды который стационарный в широком смысле и средние, и дисперсии постоянны во времени (E (Иксп + м) = E (Иксп) = μИкс и var (Иксп + м) = var (Иксп) и аналогично для переменной Y). В этом случае кросс-ковариация и взаимная корреляция являются функциями разницы во времени:

кросс-ковариация
взаимная корреляция

Если Y та же переменная, что и Икс, приведенные выше выражения называются автоковариация и автокорреляция:

автоковариация
автокорреляция

Рекомендации

  1. ^ Вайсштейн, Эрик В. "Ковариация". MathWorld.
  2. ^ Вайсштейн, Эрик В. «Статистическая корреляция». MathWorld.