Критерий сфокусированной информации - Focused information criterion
В статистика, то целевой информационный критерий (FIC) это метод выбора наиболее подходящей модели среди множества конкурентов для данного набора данных. В отличие от большинства других выбор модели стратегии, такие как Информационный критерий Акаике (AIC), Байесовский информационный критерий (BIC) и критерий отклонения информации (DIC), FIC не пытается оценить полное соответствие моделей-кандидатов, а фокусирует внимание непосредственно на параметре, представляющем основной интерес, с помощью статистического анализа, например , для которых конкурирующие модели приводят к разным оценкам, например для модели . Метод FIC состоит в том, чтобы сначала разработать точное или приблизительное выражение для точности или качества каждого оценщик, сказать за , а затем использовать данные для оценки этих показателей точности, например . В конце выбирается модель с наилучшей оценкой точности. Методология FIC была разработана Герда Клаескенс и Нильс Лид Хьорт, первая из двух дискуссионных статей 2003 г. Журнал Американской статистической ассоциации и позже в других статьях и в их книге 2008 года.
Конкретные формулы и реализация для FIC зависят, прежде всего, от конкретного интересующего параметра, выбор которого зависит не от математики, а от научного и статистического контекста. Таким образом, устройство FIC может выбирать одну модель как наиболее подходящую для оценки квантиля распределения, но предпочитая другую модель как лучшую для оценки среднего значения. Во-вторых, формулы FIC зависят от специфики моделей, используемых для наблюдаемых данных, а также от того, как должна быть измерена точность. Самый ясный случай - это когда считается, что точность среднеквадратичная ошибка, сказать с точки зрения квадрат смещения и отклонение для оценщика, связанного с моделью . Формулы FIC доступны в различных ситуациях, как для обработки параметрический, полупараметрический и непараметрический ситуации, включающие раздельную оценку квадрата смещения и дисперсии, приводящие к оценке точности . В итоге FIC выбирает модель с наименьшей оценкой среднеквадратичной ошибки.
Использование FIC для выбора хорошей модели связано с Сюжет FIC, призванный дать четкое и информативное представление обо всех оценках всех моделей-кандидатов и их достоинствах. Он отображает оценки по оси вместе с оценками FIC на ось; таким образом, оценки, находящиеся слева на графике, связаны с лучшими моделями, а те, которые находятся в середине и справа, относятся к моделям, менее или неадекватным для целей оценки рассматриваемого параметра фокуса.
Вообще говоря, сложные модели (со многими параметрами относительно размер образца ) имеют тенденцию приводить к оценкам с небольшим смещением, но большим разбросом; более экономные модели (с меньшим количеством параметров) обычно дают оценки с большим смещением, но меньшей дисперсией. Метод FIC оптимальным образом уравновешивает два желаемых данных: малое смещение и малое отклонение. Основная сложность заключается в предвзятости , поскольку он включает в себя расстояние от ожидаемого значения оценщика до истинной базовой величины, которая должна быть оценена, а истинный механизм генерации данных может находиться за пределами каждой из моделей-кандидатов.
В ситуациях, когда существует не уникальный параметр фокуса, а скорее их семейство, существуют версии средний FIC (AFIC или wFIC), которые находят лучшую модель с точки зрения должным образом взвешенных показателей производительности, например при поиске регресс модель, чтобы работать особенно хорошо в части ковариантный Космос.
Также можно оставить несколько лучших моделей на борту, завершив статистический анализ средневзвешенным значением оценщиков лучших оценок FIC, как правило, давая наивысший вес оценщикам, связанным с лучшими оценками FIC. Такие схемы усреднение модели расширить метод прямого выбора FIC.
Методология FIC применяется, в частности, к выбору переменных в различных формах регрессивный анализ, в том числе в рамках обобщенные линейные модели и полупараметрический модели пропорциональных опасностей (т.е. регрессия Кокса).
Смотрите также
Рекомендации
Эта статья может чрезмерно полагаться на источники слишком тесно связан с предметом, потенциально препятствуя публикации статьи проверяемый и нейтральный.Март 2012 г.) (Узнайте, как и когда удалить этот шаблон сообщения) ( |
Эта статья включает Список ссылок, связанное чтение или внешняя ссылка, но его источники остаются неясными, потому что в нем отсутствует встроенные цитаты.Май 2015 г.) (Узнайте, как и когда удалить этот шаблон сообщения) ( |
- Клаескенс, Г. и Hjort, N.L. (2003). «Критерий сфокусированной информации» (с обсуждением). Журнал Американской статистической ассоциации, том 98, стр. 879–899. Дои:10.1198/016214503000000819
- Hjort, N.L. и Клаескенс, Г. (2003). «Средние оценки модели Frequentist» (с обсуждением). Журнал Американской статистической ассоциации, том 98, стр. 900–916. Дои:10.1198/016214503000000828
- Hjort, N.L. и Клаескенс, Г. (2006). «Целенаправленные информационные критерии и модели усреднения для модели регрессии рисков Кокса». Журнал Американской статистической ассоциации, том 101, стр. 1449–1464. Дои:10.1198/016214506000000069
- Клаескенс Г. и Хьорт Н.Л. (2008). Выбор модели и усреднение модели. Издательство Кембриджского университета.
внешняя ссылка
- Интервью по усреднению частотной модели с основными научными показателями
- Веб-страница для выбора модели и усреднения модели книга Клаескена и Хьорта