Отклонение (статистика) - Deviance (statistics)

В статистика, отклонение это добродетель статистика для статистическая модель; это часто используется для статистическая проверка гипотез. Это обобщение идеи использования суммы квадратов остатки в обыкновенный метод наименьших квадратов в случаях, когда подгонка модели достигается максимальная вероятность. Он играет важную роль в модели экспоненциальной дисперсии и обобщенные линейные модели.

Определение

Единичное отклонение[1][2] - двумерная функция, удовлетворяющая следующим условиям:

Полное отклонение модели с прогнозами наблюдения это сумма его единичных отклонений: .

(Общее) отклонение для модели M0 с оценками , на основе набора данных у, может быть построен по вероятности как:[3][4]

Здесь обозначает подогнанные значения параметров в модели M0, пока обозначает подогнанные параметры для насыщенная модель: оба набора подобранных значений неявно являются функциями наблюдений у. Здесь насыщенная модель - это модель с параметром для каждого наблюдения, чтобы данные точно соответствовали. Это выражение просто в 2 раза больше логарифмическое отношение правдоподобия полной модели по сравнению с уменьшенной моделью. Отклонение используется для сравнения двух моделей - в частности, в случае обобщенные линейные модели (GLM), где он играет роль, аналогичную остаточной дисперсии от ANOVA в линейных моделях (RSS ).

Допустим, в рамках GLM у нас есть два вложенные модели, M1 и M2. В частности, предположим, что M1 содержит параметры в M2, и k дополнительные параметры. Тогда при нулевой гипотезе M2 является истинной моделью, разница между отклонениями для двух моделей следует на основе Теорема Уилкса, приблизительный распределение хи-квадрат с k-степени свободы.[4] Это можно использовать для проверки гипотез об отклонении.

Некоторое использование термина «отклонение» может сбивать с толку. По словам Коллетта:[5]

"количество иногда называют отклонение. Это [...] неуместно, поскольку в отличие от отклонения, используемого в контексте обобщенного линейного моделирования, не измеряет отклонение от модели, которая идеально подходит для данных. "Однако, поскольку основное использование заключается в форме различия отклонений двух моделей, эта путаница в определении не имеет значения.

Примеры

Единичное отклонение для распределения Пуассона равно , единичное отклонение для нормального распределения определяется выражением .

Смотрите также

Примечания

  1. ^ Йоргенсен, Б. (1997). Теория моделей дисперсии. Чепмен и Холл.
  2. ^ Песня, Петр X. -К. (2007). Коррелированный анализ данных: моделирование, аналитика и приложения. Серии Спрингера в статистике. Серия Спрингера в статистике. Дои:10.1007/978-0-387-71393-9. ISBN  978-0-387-71392-2.
  3. ^ Нелдер, Дж.; Веддерберн, Р.У.М. (1972). «Обобщенные линейные модели». Журнал Королевского статистического общества. Серия А (Общие). 135 (3): 370–384. Дои:10.2307/2344614. JSTOR  2344614. S2CID  14154576.
  4. ^ а б Маккаллах и Нелдер (1989): стр.17
  5. ^ Коллетт (2003): стр. 76

Рекомендации

  • Коллетт, Дэвид (2003). Моделирование данных о выживаемости в медицинских исследованиях, второе издание. Чепмен и Холл / CRC. ISBN  1-58488-325-1.

внешняя ссылка