Теория экстремальных ценностей - Википедия - Extreme value theory

Теория экстремальных значений используется для моделирования риска экстремальных, редких событий, таких как 1755 Лиссабонское землетрясение.

Теория экстремальных ценностей или же анализ экстремальных значений (EVA) является ветвью статистика иметь дело с крайним отклонения от медиана из распределения вероятностей. Он стремится оценить, исходя из заданного порядка образец данной случайной величины - вероятность событий, более экстремальных, чем любые из наблюдавшихся ранее. Анализ предельных значений широко используется во многих дисциплинах, таких как Строительная инженерия, финансы, науки о Земле, прогнозирование трафика и инженерная геология. Например, EVA может использоваться в области гидрология для оценки вероятности необычно большого наводнения, такого как 100-летнее наводнение. Точно так же для дизайна волнорез, а береговой инженер будет стремиться оценить 50-летнюю волну и соответствующим образом спроектировать структуру.

Анализ данных

Существует два подхода к практическому анализу экстремальных значений.

Первый метод основан на получении ряда максимумов (минимумов) блоков в качестве предварительного шага. Во многих ситуациях обычно и удобно извлекать годовые максимумы (минимумы), создавая «Годовой ряд максимальных значений» (AMS).

Второй метод основан на извлечении из непрерывной записи пиковых значений, достигнутых за любой период, в течение которого значения превышают определенный порог (падают ниже определенного порога). Этот метод обычно называют «пик превышения порогового значения». [1] метод (POT).

Для данных AMS анализ может частично полагаться на результаты Теорема Фишера – Типпета – Гнеденко., ведущий к обобщенное распределение экстремальных значений отбирается для примерки.[2][3] Однако на практике для выбора между более широким диапазоном распределений применяются различные процедуры. Теорема здесь относится к предельным распределениям для минимума или максимума очень большого набора независимый случайные переменные из той же раздачи. Учитывая, что количество соответствующих случайных событий в течение года может быть довольно ограниченным, неудивительно, что анализ наблюдаемых данных AMS часто приводит к выбору распределений, отличных от общего распределения экстремальных значений (GEVD).[4]

Для данных POT анализ может включать подгонку двух распределений: одно для количества событий за рассматриваемый период времени, а второе для размера превышений.

Распространенным предположением для первого является распределение Пуассона, с обобщенное распределение Парето используется для превышений. А обтяжка может основываться на Теорема Пикандса – Балкемы – де Хаана..[5][6]

Новак[7] термин «метод POT» резервируется для случая, когда порог не является случайным, и отличает его от случая, когда речь идет о превышении случайного порога.

Приложения

Приложения теории экстремальных значений включают прогнозирование распределения вероятностей:

История

Пионером в области теории экстремальных значений был Леонард Типпетт (1902–1985). Типпет был нанят Британская ассоциация исследований хлопковой промышленности, где он работал над укреплением хлопковой нити. В своих исследованиях он понял, что прочность нити контролируется прочностью ее самых слабых волокон. С помощью Р. А. Фишер Типпет получил три асимптотических предела, описывающих распределения экстремумов в предположении независимых переменных. Эмиль Юлиус Гамбель систематизировал эту теорию в своей книге 1958 г. Статистика крайностей, в том числе Распределения Gumbel носят его имя. Эти результаты могут быть расширены, чтобы учесть небольшие корреляции между переменными, но классическая теория не распространяется на сильные корреляции порядка дисперсии. Особый интерес представляет один класс универсальности: лог-коррелированные поля, где корреляции логарифмически убывают с расстоянием.

Краткое содержание исторически важных публикаций по теории экстремальных ценностей можно найти в статье. Список публикаций в статистике.

Одномерная теория

Позволять быть последовательностью независимые и одинаково распределенные случайные величины с кумулятивная функция распределения F и разреши обозначают максимум.

Теоретически точное распределение максимума может быть получено:

Связанный индикаторная функция это Процесс Бернулли с вероятностью успеха это зависит от величины экстремального события. Количество экстремальных явлений в пределах судебные процессы, таким образом, следует биномиальное распределение а количество попыток до наступления события следует за геометрическое распределение с ожидаемым значением и стандартным отклонением того же порядка .

На практике у нас может не быть функции распределения но Теорема Фишера – Типпета – Гнеденко. дает асимптотический результат. Если существуют последовательности констант и такой, что

в качестве тогда

куда зависит от формы хвоста распределения. грамм принадлежит к одному из следующих не-вырожденное распределение семьи:

Закон Вейбулла: когда распределение имеет легкий хвост с конечной верхней границей. Также известен как Тип 3.

Закон Гамбеля: когда распределение имеет экспоненциальный хвост. Также известен как Тип 1

Fréchet Law: когда распределение имеет тяжелый хвост (включая полиномиальное затухание). Также известен как Тип 2.

Во всех случаях, .

Многомерная теория

Теория экстремальных значений более чем одной переменной ставит дополнительные проблемы, которые необходимо решить. Одна из возникающих проблем заключается в том, что нужно указать, что составляет экстремальное событие.[19] Хотя это просто в одномерном случае, однозначного способа сделать это в многомерном случае нет. Основная проблема заключается в том, что, хотя можно упорядочить набор действительных чисел, нет естественного способа упорядочить набор векторов.

Например, в одномерном случае с учетом набора наблюдений найти наиболее экстремальное событие несложно, просто взяв максимум (или минимум) наблюдений. Однако в двумерном случае с учетом набора наблюдений , не сразу понятно, как найти самое экстремальное событие. Предположим, что измерены значения в определенное время и значения позже. Какое из этих событий можно было бы считать более экстремальным? На этот вопрос нет универсального ответа.

Еще одна проблема в многомерном случае состоит в том, что предельная модель не так полно предписана, как в одномерном случае. В одномерном случае модель (Распределение GEV ) содержит три параметра, значения которых не предсказываются теорией и должны быть получены путем подгонки распределения к данным. В многомерном случае модель содержит не только неизвестные параметры, но и функцию, точный вид которой не предписывается теорией. Однако эта функция должна подчиняться определенным ограничениям.[20][21]

В качестве примера применения двумерная теория экстремальных значений была применена к исследованию океана.[19][22]

Смотрите также

Примечания

  1. ^ Ледбеттер, М. Р. (1991). «На основе моделирования« Пики выше порога »». Статистика и вероятностные письма. 12 (4): 357–362. Дои:10.1016/0167-7152(91)90107-3.
  2. ^ Фишер и Типпетт (1928)
  3. ^ Гнеденко (1943)
  4. ^ Эмбрехтс, Клюппельберг и Микош (1997)
  5. ^ Пиканды (1975)
  6. ^ Балкема и де Хаан (1974)
  7. ^ Новак (2011)
  8. ^ | doi = 10.1126 / science.aah7393
  9. ^ Батт, Райан Д .; Карпентер, Стивен Р .; Айвз, Энтони Р. (март 2017 г.). «Экстремальные явления во временных рядах экосистемы озера». Письма по лимнологии и океанографии. 2 (3): 63. Дои:10.1002 / lol2.10037.
  10. ^ Альвардо (1998, стр.68).
  11. ^ Макконен (2008)
  12. ^ J.H.J. Einmahl & S.G.W.R. Смец (2009), «Лучшие 100-метровые мировые рекорды благодаря теории исключительной ценности» (PDF), Документ для обсуждения CentER, Тилбургский университет, 57, заархивировано из оригинал (PDF) на 2016-03-12, получено 2009-08-12CS1 maint: использует параметр авторов (связь)
  13. ^ Д. Гембрис, Дж. Тейлор и Д. Сутер (2002), «Тенденции и случайные колебания в легкой атлетике», Природа, 417 (6888): 506, Bibcode:2002Натура 417..506Г, Дои:10.1038 / 417506a, HDL:2003/25362, PMID  12037557, S2CID  13469470CS1 maint: использует параметр авторов (связь)
  14. ^ Д. Гембрис, Дж. Тейлор и Д. Сутер (2007), «Эволюция спортивных рекордов: статистические эффекты против реальных улучшений», Журнал прикладной статистики, 34 (5): 529–545, Дои:10.1080/02664760701234850, HDL:2003/25404, S2CID  55378036CS1 maint: использует параметр авторов (связь)
  15. ^ Сонгчитрукса, П .; Тарко, А. П. (2006). «Теоретико-экстремальный подход к оценке безопасности». Анализ и предотвращение аварий. 38 (4): 811–822. Дои:10.1016 / j.aap.2006.02.003. PMID  16546103.
  16. ^ Орсини, Ф .; Gecchele, G .; Гастальди, М .; Росси, Р. (2019). «Предсказание столкновений на круговых перекрестках: сравнительное исследование подходов теории экстремальных значений». Transportmetrica A: Транспортная наука. 15 (2): 556–572. Дои:10.1080/23249935.2018.1515271. S2CID  158343873.
  17. ^ К. Г. Цинос, Ф. Фукалас, Т. Хаттаб и Л. Лай "О выборе канала для систем агрегации несущих. "IEEE Transactions on Communications, Vol. 66, No. 2, Feb. 2018) 808-818.
  18. ^ Вонг, Феликс; Коллинз, Джеймс Дж. (02.11.2020). «Доказательства того, что сверхраспространение коронавируса носит толстый хвост». Труды Национальной академии наук. Дои:10.1073 / pnas.2018490117. ISSN  0027-8424. PMID  33139561.
  19. ^ а б Morton, I.D .; Бауэрс, Дж. (Декабрь 1996 г.). «Анализ экстремальных значений в многомерной морской среде». Прикладные исследования океана. 18 (6): 303–317. Дои:10.1016 / s0141-1187 (97) 00007-2. ISSN  0141-1187.
  20. ^ Бейллант, Ян; Goegebeur, Юрий; Teugels, Jozef; Сегерс, Йохан (27 августа 2004 г.). Статистика крайностей: теория и приложения. Серия Уайли по вероятности и статистике. Чичестер, Великобритания: John Wiley & Sons, Ltd. Дои:10.1002/0470012382. ISBN  9780470012383.
  21. ^ Коулз, Стюарт (2001). «Введение в статистическое моделирование экстремальных значений». Серия Springer в статистике. Дои:10.1007/978-1-4471-3675-0. ISBN  978-1-84996-874-4. ISSN  0172-7397.
  22. ^ Zachary, S .; Feld, G .; Ward, G .; Вольфрам, Дж. (Октябрь 1998 г.). «Многомерная экстраполяция в морской среде». Прикладные исследования океана. 20 (5): 273–295. Дои:10.1016 / s0141-1187 (98) 00027-3. ISSN  0141-1187.

Рекомендации

  • Abarbanel, H .; Кунин, С .; Levine, H .; MacDonald, G .; Ротхаус, О. (январь 1992 г.), «Статистика экстремальных явлений применительно к климату» (PDF), ДЖЕЙСОН, JSR-90-30S, получено 2015-03-03
  • Альварадо, Эрнесто; Сандберг, Дэвид V .; Пикфорд, Стюарт Г. (1998), «Моделирование больших лесных пожаров как экстремальных явлений» (PDF), Северо-западная наука, 72: 66–75, архивировано с оригинал (PDF) на 2009-02-26, получено 2009-02-06
  • Balkema, A .; Laurens (1974), «Остаточное время жизни в преклонном возрасте», Анналы вероятности, 2 (5): 792–804, Дои:10.1214 / aop / 1176996548, JSTOR  2959306
  • Берри К.В. (1975). Статистические методы в прикладной науке. Джон Вили и сыновья.
  • Кастильо Э. (1988) Теория экстремальных ценностей в технике. Academic Press, Inc. Нью-Йорк. ISBN  0-12-163475-2.
  • Кастильо, Э., Хади, А.С., Балакришнан, Н. и Сарабия, Дж. М. (2005) Экстремальные и связанные модели с приложениями в технике и науке, Серия Wiley по вероятности и статистике Wiley, Хобокен, Нью-Джерси. ISBN  0-471-67172-X.
  • Коулз С. (2001) Введение в статистическое моделирование экстремальных значений. Спрингер, Лондон.
  • Эмбрехтс П., Клюппельберг К. и Микош Т. (1997) Моделирование экстремальных событий для страхования и финансов. Берлин: Весенний Верлаг
  • Fisher, R.A .; Типпетт, L.H.C. (1928), «Предельные формы частотного распределения наибольшего и наименьшего члена выборки», Proc. Camb. Фил. Soc., 24 (2): 180–190, Bibcode:1928PCPS ... 24..180F, Дои:10,1017 / с0305004100015681
  • Гнеденко, Б.В. (1943), "Sur la distribution limit du terme maximum d'une serie aleatoire", Анналы математики, 44 (3): 423–453, Дои:10.2307/1968974, JSTOR  1968974
  • Гамбель, Э.Дж. (1935), "Les valeurs extrêmes des distributions statistiques" (PDF), Annales de l'Institut Анри Пуанкаре, 5 (2): 115–158, получено 2009-04-01
  • Гамбель, Э. Дж. (2004) [1958], Статистика крайностей, Минеола, Нью-Йорк: Дувр, ISBN  978-0-486-43604-3
  • Макконен, Л. (2008), "Проблемы анализа экстремальных значений", Структурная безопасность, 30 (5): 405–419, Дои:10.1016 / j.strusafe.2006.12.001
  • Лидбеттер, М. Р. (1991), «На основе моделирования« Пики выше порога »», Письма о статистике и вероятности, 12 (4): 357–362, Дои:10.1016/0167-7152(91)90107-3
  • Лидбеттер М.Р., Линдгрен Г. и Рутцен Х. (1982) Крайности и связанные с ними свойства случайных последовательностей и процессов. Спрингер-Верлаг, Нью-Йорк.
  • Lindgren, G .; Рутцен, Х. (1987), "Экстремальные значения: теория и технические приложения", Скандинавский журнал статистики, теории и приложений, 14: 241–279
  • Новак С.Ю. (2011) Экстремальные методы применения в финансах. Chapman & Hall / CRC Press, Лондон. ISBN  978-1-4398-3574-6
  • Пикандс, Дж. (1975), «Статистический вывод с использованием статистики крайнего порядка», Анналы статистики, 3: 119–131, Дои:10.1214 / aos / 1176343003

Программного обеспечения

внешняя ссылка