Отклонение (статистика) - Deviance (statistics)
В статистика, отклонение это добродетель статистика для статистическая модель; это часто используется для статистическая проверка гипотез. Это обобщение идеи использования суммы квадратов остатки в обыкновенный метод наименьших квадратов в случаях, когда подгонка модели достигается максимальная вероятность. Он играет важную роль в модели экспоненциальной дисперсии и обобщенные линейные модели.
Определение
Единичное отклонение[1][2] - двумерная функция, удовлетворяющая следующим условиям:
Полное отклонение модели с прогнозами наблюдения это сумма его единичных отклонений: .
(Общее) отклонение для модели M0 с оценками , на основе набора данных у, может быть построен по вероятности как:[3][4]
Здесь обозначает подогнанные значения параметров в модели M0, пока обозначает подогнанные параметры для насыщенная модель: оба набора подобранных значений неявно являются функциями наблюдений у. Здесь насыщенная модель - это модель с параметром для каждого наблюдения, чтобы данные точно соответствовали. Это выражение просто в 2 раза больше логарифмическое отношение правдоподобия полной модели по сравнению с уменьшенной моделью. Отклонение используется для сравнения двух моделей - в частности, в случае обобщенные линейные модели (GLM), где он играет роль, аналогичную остаточной дисперсии от ANOVA в линейных моделях (RSS ).
Допустим, в рамках GLM у нас есть два вложенные модели, M1 и M2. В частности, предположим, что M1 содержит параметры в M2, и k дополнительные параметры. Тогда при нулевой гипотезе M2 является истинной моделью, разница между отклонениями для двух моделей следует на основе Теорема Уилкса, приблизительный распределение хи-квадрат с k-степени свободы.[4] Это можно использовать для проверки гипотез об отклонении.
Некоторое использование термина «отклонение» может сбивать с толку. По словам Коллетта:[5]
- "количество иногда называют отклонение. Это [...] неуместно, поскольку в отличие от отклонения, используемого в контексте обобщенного линейного моделирования, не измеряет отклонение от модели, которая идеально подходит для данных. "Однако, поскольку основное использование заключается в форме различия отклонений двух моделей, эта путаница в определении не имеет значения.
Примеры
Единичное отклонение для распределения Пуассона равно , единичное отклонение для нормального распределения определяется выражением .
Смотрите также
- Информационный критерий Акаике
- Информационный критерий отклонения
- Тест Хосмера – Лемешоу, статистика качества соответствия, которая может использоваться для двоичных данных
- Критерий хи-квадрат Пирсона, альтернативное качество статистики соответствия для обобщенные линейные модели для подсчета данных
- Критерий Пирса
Примечания
- ^ Йоргенсен, Б. (1997). Теория моделей дисперсии. Чепмен и Холл.
- ^ Песня, Петр X. -К. (2007). Коррелированный анализ данных: моделирование, аналитика и приложения. Серии Спрингера в статистике. Серия Спрингера в статистике. Дои:10.1007/978-0-387-71393-9. ISBN 978-0-387-71392-2.
- ^ Нелдер, Дж.; Веддерберн, Р.У.М. (1972). «Обобщенные линейные модели». Журнал Королевского статистического общества. Серия А (Общие). 135 (3): 370–384. Дои:10.2307/2344614. JSTOR 2344614. S2CID 14154576.
- ^ а б Маккаллах и Нелдер (1989): стр.17
- ^ Коллетт (2003): стр. 76
Рекомендации
- Маккаллах, Питер; Нелдер, Джон (1989). Обобщенные линейные модели, второе издание. Чепмен и Холл / CRC. ISBN 0-412-31760-5.
- Коллетт, Дэвид (2003). Моделирование данных о выживаемости в медицинских исследованиях, второе издание. Чепмен и Холл / CRC. ISBN 1-58488-325-1.
внешняя ссылка
- Обобщенные линейные модели - Эдвард Ф. Коннор
- Заметки к лекциям по девиансам