Выбор модели - Model selection
Эта статья поднимает множество проблем. Пожалуйста помоги Улучши это или обсудите эти вопросы на страница обсуждения. (Узнайте, как и когда удалить эти сообщения-шаблоны) (Узнайте, как и когда удалить этот шаблон сообщения)
|
Выбор модели это задача выбора статистическая модель из набора моделей-кандидатов с заданными данными. В простейших случаях рассматривается уже существующий набор данных. Однако в задачу может входить и дизайн экспериментов так что данные собранные хорошо подходит для задачи выбора модели. Учитывая возможные модели с аналогичной предсказательной или объяснительной силой, простейшая модель, скорее всего, будет лучшим выбором (бритва Оккама ).
Кониси и Китагава (2008), п. 75) говорится: «Большинство проблем в статистические выводы можно рассматривать как проблемы, связанные со статистическим моделированием ». Кокс (2006), п. 197) сказал: «Как [] перевод от предметной проблемы к статистической модели часто является наиболее важной частью анализа».
Выбор модели может также относиться к проблеме выбора нескольких репрезентативных моделей из большого набора вычислительных моделей с целью принимать решение или оптимизация в условиях неопределенности. [1]
Вступление
В самых основных формах выбор модели является одной из фундаментальных задач Научное исследование. Определение принципа, объясняющего серию наблюдений, часто напрямую связано с математической моделью, предсказывающей эти наблюдения. Например, когда Галилео выполнил свой наклонная плоскость экспериментов, он продемонстрировал, что движение шаров соответствует параболе, предсказанной его моделью.[нужна цитата ].
Из бесчисленного количества возможных механизмов и процессов, которые могли бы произвести данные, как можно даже начать выбирать лучшую модель? Обычно используемый математический подход определяет набор моделей-кандидатов; этот набор должен быть выбран исследователем. Часто простые модели, такие как многочлены используются, по крайней мере, изначально[нужна цитата ]. Бернхэм и Андерсон (2002) на протяжении всей своей книги подчеркивают важность выбора моделей, основанных на надежных научных принципах, таких как понимание феноменологических процессов или механизмов (например, химических реакций), лежащих в основе данных.
После выбора набора моделей-кандидатов статистический анализ позволяет нам выбрать лучшую из этих моделей. Что имеется в виду под Лучший является спорным. Хорошая техника выбора модели уравновесит степень соответствия с простотой[нужна цитата ]. Более сложные модели смогут лучше адаптировать свою форму для соответствия данным (например, полином пятого порядка может точно соответствовать шести точкам), но дополнительные параметры могут не представлять ничего полезного. (Возможно, эти шесть точек на самом деле просто случайным образом распределены по прямой.) Степень соответствия обычно определяется с использованием отношение правдоподобия подход или его приближение, приводящее к критерий хи-квадрат. Сложность обычно измеряется путем подсчета количества параметры в модели.
Методы выбора модели можно рассматривать как оценщики некоторой физической величины, такой как вероятность того, что модель предоставит данные. В предвзятость и отклонение оба являются важными показателями качества этого оценщика; эффективность также часто рассматривается.
Стандартный пример выбора модели - это подгонка кривой, где, учитывая набор баллов и другие базовые знания (например, баллы являются результатом i.i.d. образцы), мы должны выбрать кривую, которая описывает функцию, которая генерировала точки.
Методы, помогающие выбрать набор моделей-кандидатов
Критерии
Ниже приводится список критериев выбора модели. Наиболее часто используемые критерии - это (i) информационный критерий Акаике и (ii) байесовский фактор и / или байесовский информационный критерий (который до некоторой степени приближается к байесовскому фактору).
- Информационный критерий Акаике (AIC), мера соответствия оценочной статистической модели
- Фактор Байеса
- Байесовский информационный критерий (BIC), также известный как информационный критерий Шварца, статистический критерий для выбора модели
- Перекрестная проверка
- Информационный критерий отклонения (DIC), еще один критерий выбора байесовской модели
- Уровень ложного обнаружения
- Критерий сфокусированной информации (FIC), критерий выбора, сортирующий статистические модели по их эффективности для заданного параметра фокуса.
- Информационный критерий Ханнана – Куинна, альтернатива критериям Акаике и Байесу
- Кашьяпский информационный критерий (KIC) - мощная альтернатива AIC и BIC, потому что KIC использует информационную матрицу Фишера.
- Тест отношения правдоподобия
- Mallows's Cп
- Минимальная длина описания
- Минимальная длина сообщения (MML)
- ПРЕССА статистика, также известный как критерий PRESS
- Минимизация структурных рисков
- Пошаговая регрессия
- Информационный критерий Ватанабэ – Акаике (WAIC), также называемый широко применимым информационным критерием
- Расширенный байесовский информационный критерий (EBIC) является расширением обычного Байесовский информационный критерий (BIC) для моделей с пространствами с высокими параметрами.
- Расширенный информационный критерий Фишера (EFIC) - это критерий выбора модели для моделей линейной регрессии.
Среди этих критериев перекрестная проверка обычно является наиболее точной и наиболее затратной в вычислительном отношении для задач обучения с учителем.
Бернхэм и Андерсон (2002), §6.3) говорят следующее (с добавленными вики-ссылками).
Существует множество методов выбора модели. Однако с точки зрения статистической производительности метода и предполагаемого контекста его использования существует только два различных класса методов: они были отмечены эффективный и последовательный. .... Согласно частотной парадигме для выбора модели обычно используются три основных подхода: (I) оптимизация некоторых критериев выбора, (II) проверка гипотез и (III) специальные методы.
Смотрите также
- Все модели неправильные
- Анализ конкурирующих гипотез
- Автоматизированное машинное обучение (AutoML)
- Дилемма смещения и дисперсии
- Выбор функции
- Парадокс Фридмана
- Поиск по сетке
- Анализ идентифицируемости
- Логлинейный анализ
- Идентификация модели
- бритва Оккама
- Оптимальный дизайн
- Проблема идентификации параметра
- Научное моделирование
- Проверка статистической модели
- Парадокс Штейна
Примечания
- ^ Shirangi, Mehrdad G .; Дурлофски, Луи Дж. (2016). «Общий метод выбора представительных моделей для принятия решений и оптимизации в условиях неопределенности». Компьютеры и науки о Земле. 96: 109–123. Bibcode:2016CG ..... 96..109S. Дои:10.1016 / j.cageo.2016.08.002.
Рекомендации
- Ах хорошо.; Derryberry, D .; Петерсон, Т. (2014), «Выбор модели для экологов: мировоззрение AIC и BIC», Экология, 95 (3): 631–636, Дои:10.1890/13-1452.1, PMID 24804445
- Акаике, Х. (1994), «Влияние информационной точки зрения на развитие статистической науки», в Боздогане, Х. (ред.), Труды Первой конференции США / ЯПОНИИ «Границы статистического моделирования: информационный подход» - Том 3, Kluwer Academic Publishers, стр. 27–38
- Андерсон, Д. (2008), Модельный вывод в науках о жизни, Спрингер, ISBN 9780387740751
- Андо, Т. (2010), Выбор байесовской модели и статистическое моделирование, CRC Press, ISBN 9781439836156
- Брейман, Л. (2001), «Статистическое моделирование: две культуры», Статистическая наука, 16: 199–231, Дои:10.1214 / сс / 1009213726
- Burnham, K.P .; Андерсон, Д. (2002), Выбор модели и многомодельный вывод: практический теоретико-информационный подход (2-е изд.), Springer-Verlag, ISBN 0-387-95364-7 [это более 38000 ссылок на Google ученый ]
- Чемберлин, Т. (1890), «Метод нескольких рабочих гипотез», Наука, 15 (366): 92–6, Bibcode:1890Sci .... 15R..92., Дои:10.1126 / science.ns-15.366.92, PMID 17782687 (перепечатано в 1965 г., Наука 148: 754–759 [1] Дои:10.1126 / science.148.3671.754 )
- Клаескенс, Г. (2016), «Выбор статистической модели» (PDF), Ежегодный обзор статистики и ее применение, 3 (1): 233–256, Bibcode:2016AnRSA ... 3..233C, Дои:10.1146 / annurev-statistics-041715-033413[постоянная мертвая ссылка ]
- Claeskens, G .; Hjort, N.L. (2008), Выбор модели и усреднение модели, Издательство Кембриджского университета, ISBN 9781139471800
- Кокс, Д. (2006), Принципы статистического вывода, Издательство Кембриджского университета
- Кашьяп, Р. (1982), "Оптимальный выбор частей AR и MA в авторегрессионных моделях скользящего среднего", IEEE Transactions по анализу шаблонов и машинному анализу, IEEE, PAMI-4 (2): 99–104, Дои:10.1109 / TPAMI.1982.4767213, PMID 21869012, S2CID 18484243
- Konishi, S .; Китагава, Г. (2008), Информационные критерии и статистическое моделирование, Спрингер, Bibcode:2007icsm.book ..... K, ISBN 9780387718866
- Лахири, П. (2001), Выбор модели, Институт математической статистики
- Leeb, H .; Пётчер, Б. М. (2009), «Выбор модели», Андерсон, Т. Г. (ред.), Справочник финансовых временных рядов, Springer, стр. 889–925, Дои:10.1007/978-3-540-71297-8_39, ISBN 978-3-540-71296-1
- Лукач, П. М .; Thompson, W. L .; Kendall, W. L .; Gould, W. R .; Доэрти, П. Ф. мл .; Burnham, K. P .; Андерсон, Д. Р. (2007), «Обеспокоенность по поводу призыва к плюрализму теории информации и проверки гипотез», Журнал прикладной экологии, 44 (2): 456–460, Дои:10.1111 / j.1365-2664.2006.01267.x
- McQuarrie, Allan D. R .; Цай, Чи-Линг (1998), Выбор модели регрессии и временных рядов, Сингапур: World Scientific, ISBN 981-02-3242-X
- Массарт, П. (2007), Неравенства концентраций и выбор модели, Springer
- Массарт, П. (2014), «Неасимптотическое блуждание по вероятности и статистике», Линь, Сихун (ред.), Прошлое, настоящее и будущее статистической науки, Чепмен и Холл, п. 309–321, г. ISBN 9781482204988
- Наварро, Д. Дж. (2019), «Между дьяволом и глубоким синим морем: напряженность между научным суждением и выбором статистической модели», Вычислительный мозг и поведение, 2: 28–34, Дои:10.1007 / s42113-018-0019-z
- Ресенде, Пауло Анджело Алвес; Дореа, Чанг Чунг Ю (2016), «Идентификация модели с использованием критерия эффективного определения», Журнал многомерного анализа, 150: 229–244, arXiv:1409.7441, Дои:10.1016 / j.jmva.2016.06.002, S2CID 5469654
- Шмуэли, Г. (2010), "Объяснить или предсказать?", Статистическая наука, 25 (3): 289–310, arXiv:1101.0891, Дои:10.1214 / 10-STS330, МИСТЕР 2791669, S2CID 15900983
- Wit, E .; van den Heuvel, E .; Romeijn, J.-W. (2012), "'Все модели ошибочны ... ': введение в неопределенность модели » (PDF), Statistica Neerlandica, 66 (3): 217–236, Дои:10.1111 / j.1467-9574.2012.00530.x
- Wit, E .; McCullagh, P. (2001), Viana, M.A.G .; Ричардс, Д. С. П. (ред.), "Расширяемость статистических моделей", Алгебраические методы в статистике и теории вероятностей, стр. 327–340
- Войтович, Анна; Bigaj, Tomasz (2016), «Обоснование, подтверждение и проблема взаимоисключающих гипотез», в Kuźniar, Adrian; Odrow-Sypniewska, Иоанна (ред.), Раскрытие фактов и ценностей, Brill Publishers, стр. 122–143, Дои:10.1163/9789004312654_009, ISBN 9789004312654
- Оуранг, Араш; Янссон, Магнус (2018), «Критерий выбора модели для многомерной линейной регрессии», Транзакции IEEE при обработке сигналов , 66 (13): 3436–3446, Bibcode:2018ITSP ... 66.3436O, Дои:10.1109 / TSP.2018.2821628, ISSN 1941-0476, S2CID 46931136