Обобщенное распределение экстремальных значений - Generalized extreme value distribution

Обозначение
Параметрыμрместо расположения,
σ > 0 — шкала,
ξрформа.
ПоддерживатьИкс ∈ [ μσ / ξ, + ∞), когда ξ > 0,
Икс ∈ (−∞, + ∞), когда ξ = 0,
Икс ∈ (−∞, μσ / ξ ] когда ξ < 0.
PDF

 

куда
CDF за Икс ∈ поддержка
Иметь в виду

куда граммk = Γ (1 − ),
и является Постоянная Эйлера.
Медиана
Режим
Дисперсия.
Асимметрия
куда это функция знака
и это Дзета-функция Римана
Бывший. эксцесс
Энтропия
MGF[1]
CF[1]

В теория вероятности и статистика, то обобщенное экстремальное значение (GEV) распределение это семья непрерывных распределения вероятностей разработан в теория экстремальных ценностей объединить Гамбель, Фреше и Weibull семейства, также известные как распределения экстремальных значений типа I, II и III. Посредством теорема об экстремальном значении распределение GEV - единственно возможное предельное распределение правильно нормированных максимумов последовательности независимых и одинаково распределенных случайных величин.[2] Обратите внимание, что должно существовать предельное распределение, которое требует условий регулярности в хвосте распределения. Несмотря на это, распределение GEV часто используется в качестве приближения для моделирования максимумов длинных (конечных) последовательностей случайных величин.

В некоторых областях применения обобщенное распределение экстремальных значений известно как Распределение Фишера – Типпета, названный в честь Рональд Фишер и Л. Х. К. Типпетт кто распознал три различные формы, описанные ниже. Однако использование этого имени иногда ограничивается особым случаем Гамбель раздача. Происхождение общей функциональной формы для всех трех распределений восходит, по крайней мере, к Дженкинсону А. Ф. (1955),[3] хотя якобы[4] это могло также быть дано Mises, R. (1936).[5]

Технические характеристики

Использование стандартизованной переменной куда параметр местоположения может быть любым действительным числом и - масштабный параметр; кумулятивная функция распределения распределения GEV тогда

куда параметр формы может быть любым действительным числом. Таким образом, для , выражение справедливо для в то время как для это действительно для В первом случае - отрицательная нижняя конечная точка, где равно 0; во втором случае положительная верхняя конечная точка, где равно 1. Для второе выражение формально не определено и заменяется первым выражением, которое является результатом взятия предела второго, как в таком случае может быть любым действительным числом.

В частном случае среднего так и для любых значений и должно быть.

Функция плотности вероятности стандартизованного распределения равна

снова действительно для в случае и для в случае Плотность равна нулю за пределами соответствующего диапазона. В случае плотность положительна на всей реальной линии.

Поскольку кумулятивная функция распределения обратима, функция квантили для распределения GEV имеет явное выражение, а именно

и поэтому квантильная функция плотности является

Годен до и для любого реального

Пример функций плотности вероятности для распределений семейства GEV.

Сводные статистические данные

Вот некоторые простые статистические данные о распределении:[нужна цитата ]

за

В перекос для ξ> 0

При ξ <0 знак числителя меняется на противоположный.

Избыток эксцесс является:

куда , k = 1,2,3,4 и это гамма-функция.

Связь с семьями Фреше, Вейбулла и Гумбеля

Параметр формы управляет хвостовым поведением распределения. Подсемейства, определенные , и соответствуют, соответственно, семействам Gumbel, Fréchet и Weibull, чьи кумулятивные функции распределения показаны ниже.

  • Гамбель или распределение экстремальных значений типа I ()
  • Фреше или распределение экстремальных значений типа II, если и
  • Обратный Weibull или распределение экстремальных значений типа III, если и

В следующих подразделах говорится о свойствах этих распределений.

Модификация минимумов, а не максимумов

Теория здесь относится к максимумам данных, и обсуждаемое распределение представляет собой распределение экстремальных значений для максимумов. Обобщенное распределение экстремальных значений для минимумов данных можно получить, например, подставив (-Икс) за Икс в функции распределения и вычитание из единицы: это дает отдельное семейство распределений.

Альтернативное соглашение для распределения Вейбулла

Обычное распределение Вейбулла возникает в приложениях надежности и получается из распределения здесь с помощью переменной , что дает строго положительную поддержку - в отличие от использования здесь в теории экстремальных ценностей. Это происходит потому, что обычное распределение Вейбулла используется в случаях, когда речь идет о минимумах данных, а не о максимумах данных. Распределение здесь имеет дополнительный параметр по сравнению с обычной формой распределения Вейбулла и, кроме того, обратное, так что распределение имеет верхнюю границу, а не нижнюю границу. Важно отметить, что в приложениях GEV верхняя граница неизвестна и поэтому должна быть оценена, в то время как при применении обычного распределения Вейбулла в приложениях надежности нижняя граница обычно равна нулю.

Диапазоны распределений

Обратите внимание на различия в диапазонах, представляющих интерес для трех распределений экстремальных значений: Гамбель безлимитно, Фреше имеет нижний предел, а обратный Weibull имеет верхний предел. Теория экстремальных значений (одномерная теория) описывает, какой из трех является предельным законом в соответствии с исходным законом X и, в частности, в зависимости от его хвоста.

Распределение переменных журнала

Связать тип I с типами II и III можно следующим образом: если кумулятивная функция распределения некоторой случайной величины имеет тип II, и положительные числа служат опорой, т.е. , то кумулятивная функция распределения относится к типу I, а именно . Аналогично, если кумулятивная функция распределения относится к типу III, и с отрицательными числами в качестве опоры, т.е. , то кумулятивная функция распределения относится к типу I, а именно .

Ссылка на модели логита (логистическая регрессия)

Полиномиальный логит модели и некоторые другие типы логистическая регрессия, можно сформулировать как скрытая переменная модели с переменные ошибки распространяется как Распределения Gumbel (обобщенные распределения экстремальных значений I типа). Эта формулировка распространена в теории дискретный выбор модели, которые включают модели logit, пробит модели, и различные их расширения, и вытекает из того факта, что разница двух переменных, распределенных GEV типа I, следует логистическая дистрибуция, из которых функция logit это квантильная функция. Таким образом, распределение GEV типа I играет в этих логит-моделях ту же роль, что и нормальное распределение делает в соответствующих пробит-моделях.

Характеристики

В кумулятивная функция распределения обобщенного распределения экстремальных значений решает постулат стабильности уравнение.[нужна цитата ] Обобщенное распределение экстремальных значений является частным случаем max-устойчивого распределения и является преобразованием min-устойчивого распределения.

Приложения

  • Распределение GEV широко используется для обработки «хвостовых рисков» в самых разных областях, от страхования до финансов. В последнем случае он рассматривался как средство оценки различных финансовых рисков с помощью таких показателей, как Стоимость под риском.[6][7]
Соответствующее распределение вероятности GEV для месячного максимума однодневных осадков в октябре, Суринам[8]
  • Однако было обнаружено, что результирующие параметры формы лежат в диапазоне, ведущем к неопределенным средним и отклонениям, что подчеркивает тот факт, что надежный анализ данных часто невозможен.[9]

Пример для нормально распределенных переменных

Позволять быть iid. нормально распределенный случайные величины со средним 0 и дисперсией 1. Теорема Фишера – Типпета – Гнеденко. говорит нам, что,куда

.

Это позволяет нам оценить, например, среднее значение от среднего значения распределения GEV:

Связанные дистрибутивы

  1. Если тогда
  2. Если (Гамбель раздача ) тогда
  3. Если (Распределение Вейбулла ) тогда
  4. Если тогда (Распределение Вейбулла )
  5. Если (Экспоненциальное распределение ) тогда
  6. Если и тогда (видеть Logistic_distribution ).
  7. Если и тогда (Сумма нет логистическое распределение). Обратите внимание, что .

Доказательства

4. Пусть , то кумулятивное распределение является:

который является cdf для .

5. Пусть , то кумулятивное распределение является:

что является совокупным распределением .

Смотрите также

Рекомендации

  1. ^ а б Муралидхаран. Г., К. Гедес Соарес и Клаудиа Лукас (2011). «Характеристические и порождающие моменты функции обобщенного распределения экстремальных значений (GEV)». В Линде. Л. Райт (ред.), Повышение уровня моря, прибрежная инженерия, береговые линии и приливы, Chapter-14, pp. 269–276. Издательство Nova Science. ISBN  978-1-61728-655-1
  2. ^ Хаан, Лоренс; Феррейра, Ана (2007). Теория экстремальных ценностей: введение. Springer.
  3. ^ Дженкинсон, Артур Ф (1955). «Распределение повторяемости годовых максимальных (или минимальных) значений метеорологических элементов». Ежеквартальный журнал Королевского метеорологического общества. 81 (348): 158–171. Дои:10.1002 / qj.49708134804.
  4. ^ Хаан, Лоренс; Феррейра, Ана (2007). Теория экстремальных ценностей: введение. Springer.
  5. ^ Мизес, Р. фон. (1936). "La distribution de la plus grande de n valeurs". Rev. Math. Union Interbalcanique 1: 141–160.
  6. ^ Москаделли, Марко. «Моделирование операционного риска: опыт анализа данных, собранных Базельским комитетом». Доступен по SSRN 557214 (2004).
  7. ^ Guégan, D .; Хассани, Б.К. (2014), «Математическое возрождение управления рисками: экстремальное моделирование экспертных мнений», Границы финансов и экономики, 11 (1): 25–45, SSRN  2558747
  8. ^ CumFreq для подгонки распределения вероятностей [1]
  9. ^ Кьерсти Аас, лекция, NTNU, Тронхейм, 23 января 2008 г.

дальнейшее чтение