Распределение Пирсона - Pearson distribution

Диаграмма системы Пирсона, показывающая распределения типов I, III, VI, V и IV с точки зрения β1 (квадрат асимметрии) и β2 (традиционный эксцесс)

В Распределение Пирсона это семья непрерывный распределения вероятностей. Впервые он был опубликован Карл Пирсон в 1895 г. и впоследствии расширенный им в 1901 и 1916 гг. в серии статей о биостатистика.

История

Система Пирсона изначально была разработана с целью визуального моделирования перекошенный наблюдения. В то время было хорошо известно, как адаптировать теоретическую модель к первым двум. кумулянты или же моменты наблюдаемых данных: Любые распределение вероятностей может быть расширен прямо, чтобы сформировать семья в масштабе местности. За исключением патологический случаях можно создать семейство в масштабе местоположения, чтобы оно соответствовало наблюдаемым иметь в виду (первый кумулянт) и отклонение (второй кумулянт) произвольно хорошо. Однако не было известно, как построить вероятностные распределения, в которых перекос (стандартизированный третий кумулянт) и эксцесс (стандартизированный четвертый кумулянт) можно было так же свободно регулировать. Эта необходимость стала очевидной при попытке подогнать известные теоретические модели к наблюдаемым данным, показывающим асимметрию. Примеры Пирсона включают данные о выживаемости, которые обычно асимметричны.

В своей оригинальной статье Пирсон (1895, стр. 360) определил четыре типа распределений (пронумерованных с I по IV) в дополнение к распределению. нормальное распределение (который изначально был известен как тип V). Классификация зависела от того, были ли распределения поддержанный на ограниченном интервале, на полупрямой или в целом реальная линия; и были ли они потенциально искажены или обязательно симметричны. Во второй статье (Pearson 1901) было исправлено два упущения: он переопределил распределение типа V (первоначально просто нормальное распределение, но теперь обратное гамма-распределение ) и представил распределение типа VI. Вместе первые две статьи охватывают пять основных типов системы Пирсона (I, III, IV, V и VI). В третьей статье Пирсон (1916) ввел дополнительные частные случаи и подтипы (с VII по XII).

Райнд (1909, стр. 430–432) разработал простой способ визуализации пространства параметров системы Пирсона, который впоследствии был принят Пирсоном (1916, табл. 1 и стр. 430 и далее, 448 и далее). Типы Пирсона характеризуются двумя величинами, обычно называемыми β1 и β2. Первый - это квадрат перекос: где γ1 асимметрия, или третья стандартизированный момент. Второй - традиционный эксцесс, или четвертый стандартизированный момент: β2 = γ2 + 3. (Современные методы лечения определяют эксцесс γ2 через кумулянты вместо моментов, так что для нормального распределения имеем γ2 = 0 и β2 = 3. Здесь мы следуем историческому прецеденту и используем β2.) На диаграмме справа показано, какой тип Пирсона представляет собой конкретное распределение (обозначенное точкой (β1, β2)) принадлежит.

Многие из искаженных и / или немезокуртика Известные нам сегодня дистрибутивы были еще неизвестны в начале 1890-х годов. То, что сейчас известно как бета-распространение использовался Томас Байес как апостериорное распределение параметра Распределение Бернулли в его работе 1763 г. обратная вероятность. Бета-распределение приобрело известность благодаря своей принадлежности к системе Пирсона и до 1940-х годов было известно как распределение Пирсона типа I.[1] (Распределение Пирсона типа II является частным случаем типа I, но обычно его больше не выделяют.) гамма-распределение возникла из работы Пирсона (Pearson 1893, p. 331; Pearson 1895, pp. 357, 360, 373–376) и была известна как распределение типа III Пирсона, прежде чем получить свое современное название в 1930-х и 1940-х годах.[2] В статье Пирсона 1895 г. введено распределение типа IV, которое содержит Студенты т-распределение как частный случай, предшествующий Уильям Сили Госсет последующее использование через несколько лет. В его статье 1901 г. обратное гамма-распределение (тип V) и бета-простое распределение (тип VI).

Определение

Пирсон плотность п определяется как любое допустимое решение дифференциальное уравнение (ср. Pearson 1895, стр. 381)

с:

По словам Орда,[3] Пирсон разработал базовую форму уравнения (1) на основе, во-первых, формулы для производной логарифма функции плотности нормальное распределение (что дает линейную функцию) и, во-вторых, из рекуррентного соотношения для значений в функция массы вероятности из гипергеометрическое распределение (что дает линейно-разделенную на квадратичную структуру).

В уравнении (1) параметр а определяет стационарный пункт, а значит, при некоторых условиях a Режим распределения, поскольку

следует непосредственно из дифференциального уравнения.

Поскольку мы сталкиваемся с линейное дифференциальное уравнение первого порядка с переменными коэффициентами, ее решение простое:

Интеграл в этом решении значительно упрощается при рассмотрении некоторых частных случаев подынтегрального выражения. Пирсон (1895, с. 367) выделил два основных случая, определяемых знаком дискриминант (а значит, и количество реальных корни ) из квадратичная функция

Особые виды распространения

Случай 1, отрицательный дискриминант

Распределение Пирсона типа IV

Если дискриминант квадратичной функции (2) отрицательный (), у него нет настоящих корней. Затем определите

Заметьте, что α - строго определенное действительное число и α ≠ 0, потому что по предположению и поэтому б2 ≠ 0. Применяя эти замены, квадратичная функция (2) преобразуется к виду

Отсутствие действительных корней очевидно из этой постановки, поскольку α2 обязательно положительный.

Выразим теперь решение дифференциального уравнения (1) как функцию у:

Пирсон (1895, стр. 362) назвал это «тригонометрическим случаем», поскольку интеграл

включает обратный тригонометрический функция arctan. потом

Наконец, пусть

Применяя эти замены, получаем параметрическую функцию:

Эта ненормализованная плотность поддерживать в целом реальная линия. Это зависит от масштабный параметр α> 0 и параметры формы м > 1/2 иν. Один параметр был потерян, когда мы решили найти решение дифференциального уравнения (1) как функцию у скорее, чем Икс. Поэтому мы вновь вводим четвертый параметр, а именно параметр местоположения λ. Таким образом, мы получили плотность Распределение Пирсона типа IV:

В нормализующая константа включает сложный Гамма-функция (Γ) и Бета-функция (B). Обратите внимание, что параметр местоположения λ здесь не то же самое, что исходный параметр местоположения, введенный в общей формулировке, но связан через

Распределение Пирсона типа VII

График плотностей типа VII Пирсона с λ = 0, σ = 1, и: γ2 = ∞ (красный); γ2 = 4 (синий); и γ2 = 0 (черный)

Параметр формы ν распределения Пирсона типа IV контролирует его перекос. Если зафиксировать его значение равным нулю, мы получим симметричное трехпараметрическое семейство. Этот особый случай известен как Распределение Пирсона типа VII (ср. Pearson 1916, p. 450). Его плотность

где B - Бета-функция.

Альтернативная параметризация (и небольшая специализация) распределения типа VII получается, если

что требует м > 3/2. Это влечет за собой небольшую потерю общности, но гарантирует, что отклонение распределения существует и равна σ2. Теперь параметр м только контролирует эксцесс распределения. Если м приближается к бесконечности как λ и σ остаются постоянными, нормальное распределение возникает как частный случай:

Это плотность нормального распределения со средним λ и стандартное отклонение σ.

Удобно потребовать, чтобы м > 5/2 и позволить

Это еще одна специализация, которая гарантирует существование первых четырех моментов раздачи. В частности, распределение Пирсона типа VII, параметризованное в терминах (λ, σ, γ2) имеет среднее значение λ, стандартное отклонение из σ, перекос нуля, и избыточный эксцесс из γ2.

Студенты т-распределение

Распределение Пирсона типа VII эквивалентно нестандартизированному Студенты т-распределение с параметрами ν> 0, μ, σ2 путем применения следующих замен к исходной параметризации:

Обратите внимание, что ограничение м > 1/2 доволен.

Результирующая плотность

что легко узнать как плотность студенческого т-распределение.

Это означает, что распределение Пирсона типа VII включает стандартную Студенты т-распределение а также стандартный Распределение Коши. В частности, стандартный студенческий т-распределение возникает как подслучай, когда μ = 0 и σ2 = 1, что эквивалентно следующим заменам:

Плотность этого ограниченного однопараметрического семейства - стандартная оценка Стьюдента. т:

Случай 2, неотрицательный дискриминант

Если квадратичная функция (2) имеет неотрицательный дискриминант (), имеет настоящие корни а1 и а2 (не обязательно отдельные):

При наличии действительных корней квадратичная функция (2) может быть записана как

и поэтому решение дифференциального уравнения есть

Пирсон (1895, стр. 362) назвал это «логарифмическим случаем», поскольку интеграл

включает только логарифм функция, а не функция arctan, как в предыдущем случае.

Используя замену

получаем следующее решение дифференциального уравнения (1):

Поскольку эта плотность известна только с точностью до скрытой константы пропорциональности, эту константу можно изменить, а плотность записать следующим образом:

Распределение Пирсона типа I

В Распределение Пирсона типа I (обобщение бета-распространение ) возникает, когда корни квадратного уравнения (2) имеют противоположный знак, т. е. . Тогда решение п поддерживается на интервале . Применить замену

куда , что дает решение в терминах у который поддерживается на интервале (0, 1):

Можно определить:

Перегруппировка констант и параметров упрощает:

Таким образом следует за с . Оказывается, что м1, м2 > −1 необходимо и достаточно для п как правильная функция плотности вероятности.

Распределение Пирсона типа II

В Распределение Пирсона типа II является частным случаем семейства Пирсона типа I, ограниченного симметричными распределениями.

Для кривой Пирсона типа II[4]

куда

Ордината, у, - частота . Кривая Пирсона типа II используется при вычислении таблицы значимых коэффициентов корреляции для Коэффициент ранговой корреляции Спирмена когда количество элементов в серии меньше 100 (или 30, в зависимости от некоторых источников). После этого дистрибутив имитирует стандартный Распределение Стьюдента. Для таблицы значений определенные значения используются в качестве констант в предыдущем уравнении:

Моменты Икс используются

Распределение Пирсона типа III

Определение

является . Распределение Пирсона типа III - это обобщенное гамма-распределение или же распределение хи-квадрат.

Распределение Пирсона типа V

Определение новых параметров:

следует за . Распределение Пирсона типа V является обратное гамма-распределение.

Распределение Пирсона типа VI

Определение

следует за . Распределение Пирсона типа VI является бета-первичное распределение или же F-распределение.

Отношение к другим дистрибутивам

Семья Пирсона включает, среди прочего, следующие распределения:

Приложения

Эти модели используются на финансовых рынках, учитывая их способность параметризоваться таким образом, чтобы они имели интуитивное значение для рыночных трейдеров. В настоящее время используется ряд моделей, отражающих стохастический характер волатильности курсов, акций и т. Д.[который? ][нужна цитата ] и это семейство дистрибутивов может оказаться одним из наиболее важных.

В Соединенных Штатах Log-Pearson III является распределением по умолчанию для анализа частоты наводнений.[5][нужна цитата ].

В последнее время было много улучшений в обобщении распределений Пирсона, чтобы сделать их более гибкими, называемыми распределениями металогов.[6]

Примечания

  1. ^ Миллер, Джефф; и другие. (2006-07-09). «Бета-распространение». Самые ранние известные варианты использования некоторых слов математики. Получено 2006-12-09.
  2. ^ Миллер, Джефф; и другие. (07.12.2006). «Гамма-распределение». Самые ранние известные варианты использования некоторых слов математики. Получено 2006-12-09.
  3. ^ Ord J.K. (1972) стр. 2
  4. ^ Рэмси, Филип Х. (1989-09-01).«Критические значения для корреляции порядка ранга Спирмена». Журнал образовательной статистики. 14 (3): 245–253. JSTOR  1165017.
  5. ^ «Рекомендации по определению частоты паводковых потоков» (PDF). USGS Water. Март 1982 г.. Получено 2019-06-14.
  6. ^ "Металог Дистрибьюшн".

Источники

Основные источники

Вторичные источники

Рекомендации

  • Элдертон, сэр В.П., Джонсон, Н.Л. (1969) Системы частотных кривых. Издательство Кембриджского университета.
  • Ord J.K. (1972) Семейства частотных распределений. Гриффин, Лондон.