Критерий сфокусированной информации - Focused information criterion

В статистика, то целевой информационный критерий (FIC) это метод выбора наиболее подходящей модели среди множества конкурентов для данного набора данных. В отличие от большинства других выбор модели стратегии, такие как Информационный критерий Акаике (AIC), Байесовский информационный критерий (BIC) и критерий отклонения информации (DIC), FIC не пытается оценить полное соответствие моделей-кандидатов, а фокусирует внимание непосредственно на параметре, представляющем основной интерес, с помощью статистического анализа, например ${ displaystyle mu}$ , для которых конкурирующие модели приводят к разным оценкам, например ${ displaystyle { hat { mu}} _ {j}}$ для модели ${ displaystyle j}$ . Метод FIC состоит в том, чтобы сначала разработать точное или приблизительное выражение для точности или качества каждого оценщик, сказать ${ displaystyle r_ {j}}$ за ${ displaystyle { hat { mu}} _ {j}}$ , а затем использовать данные для оценки этих показателей точности, например ${ displaystyle { hat {r}} _ {j}}$ . В конце выбирается модель с наилучшей оценкой точности. Методология FIC была разработана Герда Клаескенс и Нильс Лид Хьорт, первая из двух дискуссионных статей 2003 г. Журнал Американской статистической ассоциации и позже в других статьях и в их книге 2008 года.

Конкретные формулы и реализация для FIC зависят, прежде всего, от конкретного интересующего параметра, выбор которого зависит не от математики, а от научного и статистического контекста. Таким образом, устройство FIC может выбирать одну модель как наиболее подходящую для оценки квантиля распределения, но предпочитая другую модель как лучшую для оценки среднего значения. Во-вторых, формулы FIC зависят от специфики моделей, используемых для наблюдаемых данных, а также от того, как должна быть измерена точность. Самый ясный случай - это когда считается, что точность среднеквадратичная ошибка, сказать ${ displaystyle r_ {j} = b_ {j} ^ {2} + tau _ {j} ^ {2}}$ с точки зрения квадрат смещения и отклонение для оценщика, связанного с моделью ${ displaystyle j}$ . Формулы FIC доступны в различных ситуациях, как для обработки параметрический, полупараметрический и непараметрический ситуации, включающие раздельную оценку квадрата смещения и дисперсии, приводящие к оценке точности ${ displaystyle { hat {r}} _ {j}}$ . В итоге FIC выбирает модель с наименьшей оценкой среднеквадратичной ошибки.

Использование FIC для выбора хорошей модели связано с Сюжет FIC, призванный дать четкое и информативное представление обо всех оценках всех моделей-кандидатов и их достоинствах. Он отображает оценки по ${ displaystyle y}$ оси вместе с оценками FIC на ${ displaystyle x}$ ось; таким образом, оценки, находящиеся слева на графике, связаны с лучшими моделями, а те, которые находятся в середине и справа, относятся к моделям, менее или неадекватным для целей оценки рассматриваемого параметра фокуса.

Вообще говоря, сложные модели (со многими параметрами относительно размер образца ) имеют тенденцию приводить к оценкам с небольшим смещением, но большим разбросом; более экономные модели (с меньшим количеством параметров) обычно дают оценки с большим смещением, но меньшей дисперсией. Метод FIC оптимальным образом уравновешивает два желаемых данных: малое смещение и малое отклонение. Основная сложность заключается в предвзятости ${ displaystyle b_ {j}}$ , поскольку он включает в себя расстояние от ожидаемого значения оценщика до истинной базовой величины, которая должна быть оценена, а истинный механизм генерации данных может находиться за пределами каждой из моделей-кандидатов.

В ситуациях, когда существует не уникальный параметр фокуса, а скорее их семейство, существуют версии средний FIC (AFIC или wFIC), которые находят лучшую модель с точки зрения должным образом взвешенных показателей производительности, например при поиске регресс модель, чтобы работать особенно хорошо в части ковариантный Космос.

Также можно оставить несколько лучших моделей на борту, завершив статистический анализ средневзвешенным значением оценщиков лучших оценок FIC, как правило, давая наивысший вес оценщикам, связанным с лучшими оценками FIC. Такие схемы усреднение модели расширить метод прямого выбора FIC.

Методология FIC применяется, в частности, к выбору переменных в различных формах регрессивный анализ, в том числе в рамках обобщенные линейные модели и полупараметрический модели пропорциональных опасностей (т.е. регрессия Кокса).

Смотрите также

Информационный критерий Ханнана-Куинна

внешняя ссылка

Интервью по усреднению частотной модели с основными научными показателями
Веб-страница для выбора модели и усреднения модели книга Клаескена и Хьорта

Критерий сфокусированной информации - Focused information criterion

Смотрите также

Рекомендации

внешняя ссылка