Распределение Коши - Cauchy distribution

Коши
Функция плотности вероятности
Функция плотности вероятности для распределения Коши
Фиолетовая кривая - это стандартное распределение Коши.
Кумулятивная функция распределения
Кумулятивная функция распределения для распределения Коши
Параметры место расположения (настоящий )
шкала (настоящий)
Поддерживать
PDF
CDF
Квантиль
Иметь в видунеопределенный
Медиана
Режим
Дисперсиянеопределенный
Асимметриянеопределенный
Бывший. эксцесснеопределенный
Энтропия
MGFне существует
CF
Информация Fisher

В Распределение Коши, названный в честь Огюстен Коши, это непрерывное распределение вероятностей. Это также известно, особенно среди физики, как Распределение Лоренца (после Хендрик Лоренц ), Распределение Коши – Лоренца, Функция Лоренца (ian), или же Распределение Брейта – Вигнера. Распределение Коши это распределение Икс-перехват луча, выходящего из с равномерно распределенным углом. Это также распределение соотношение двух независимый нормально распределенный случайные величины с нулевым средним.

Распределение Коши часто используется в статистике как канонический пример "патологический "распространение, поскольку его ожидаемое значение и это отклонение не определены (но см. § Объяснение неопределенных моментов ниже). Распределение Коши не имеет конечных моменты порядка больше или равного единице; существуют только дробные абсолютные моменты.[1] Распределение Коши не имеет функция, производящая момент.

В математика, он тесно связан с Ядро Пуассона, какой фундаментальное решение для Уравнение лапласа в верхняя полуплоскость.

Это один из немногих дистрибутивов, стабильный и имеет функцию плотности вероятности, которая может быть выражена аналитически, остальные являются нормальное распределение и Распределение Леви.

История

Оценка среднего и стандартного отклонения по выборкам из распределения Коши (внизу) не сходится с большим количеством выборок, как в нормальное распределение (верх). В оценках могут быть сколь угодно большие скачки, как видно на графиках внизу. (Щелкните, чтобы развернуть)

Функции, имеющие вид функции плотности распределения Коши, изучались математиками еще в 17 веке, но в другом контексте и под названием ведьма Аньези. Несмотря на свое название, первый явный анализ свойств распределения Коши был опубликован французским математиком. Пуассон в 1824 году, а Коши стал ассоциироваться с ним только во время академических споров в 1853 году.[2] Таким образом, название дистрибутива является случаем Закон Стиглера эпонимии. Пуассон заметил, что если брать среднее значение наблюдений, следующих за таким распределением, то средняя ошибка не сходится к какому-либо конечному числу. В качестве таких, Лапласа использование Центральная предельная теорема с таким распределением было неуместно, поскольку предполагалось конечное среднее значение и дисперсия. Несмотря на это, Пуассон не считал этот вопрос важным, в отличие от Bienaymé, который должен был вовлечь Коши в долгий спор по этому поводу.

Характеристика

Функция плотности вероятности

Распределение Коши имеет функция плотности вероятности (PDF)[1][3]

куда это параметр местоположения, указав положение пика распределения, и это параметр масштаба который определяет полуширину на полувысоте (HWHM), альтернативно является полная ширина на половине максимальной (FWHM). также равна половине межквартильный размах и иногда называют вероятная ошибка. Огюстен-Луи Коши использовали такую ​​функцию плотности в 1827 г. бесконечно малый параметр масштаба, определяющий, что теперь будет называться Дельта-функция Дирака.

Максимальное значение или амплитуда PDF Коши составляет , расположен в .

Иногда удобно выражать PDF через комплексный параметр

Частный случай, когда и называется стандартное распределение Коши с функцией плотности вероятности[4][5]

В физике часто используется трехпараметрическая функция Лоренца:

куда высота пика. Указанная трехпараметрическая функция Лоренца, как правило, не является функцией плотности вероятности, поскольку она не интегрируется до 1, за исключением особого случая, когда

Кумулятивная функция распределения

В кумулятивная функция распределения распределения Коши:

и квантильная функция (обратный cdf ) распределения Коши есть

Отсюда следует, что первый и третий квартили , и, следовательно, межквартильный размах является .

Для стандартного распределения кумулятивная функция распределения упрощается до функция арктангенса :

Энтропия

Энтропия распределения Коши определяется выражением:

Производная от квантильная функция, квантильная функция плотности для распределения Коши имеет вид:

В дифференциальная энтропия распределения можно определить с помощью его квантильной плотности,[6] конкретно:

Распределение Коши - это распределение вероятностей максимальной энтропии для случайной вариации для которого

или, альтернативно, для случайной переменной для которого

В стандартном виде это распределение вероятностей максимальной энтропии для случайной вариации для которого[7]


Расхождение Кульбака-Лейблера

В Расхождение Кульбака-Лейблера между двумя распределениями Коши имеет следующую симметричную формулу в замкнутой форме:[8]

Характеристики

Распределение Коши - это пример распределения, не имеющего иметь в виду, отклонение или выше моменты определенный. Его Режим и медиана хорошо определены и оба равны .

Когда и два независимых нормально распределенный случайные переменные с ожидаемое значение 0 и отклонение 1, то отношение имеет стандартное распределение Коши.

Если это положительно-полуопределенная ковариационная матрица со строго положительными диагональными элементами, то для независимые и одинаково распределенные и любой случайный -вектор независим от и такой, что и (определяя категориальное распределение ) выполняется

[9]

Если находятся независимые и одинаково распределенные случайные величины, каждая из которых имеет стандартное распределение Коши, то выборочное среднее имеет то же стандартное распределение Коши. Чтобы убедиться, что это правда, вычислите характеристическая функция выборочного среднего:

куда - выборочное среднее. Этот пример показывает, что условие конечной дисперсии Центральная предельная теорема нельзя уронить. Это также пример более обобщенной версии центральной предельной теоремы, характерной для всех стабильные дистрибутивы, частным случаем которой является распределение Коши.

Распределение Коши - это безгранично делимое распределение вероятностей. Это также строго стабильный распределение.[10]

Стандартное распределение Коши совпадает с Студенты т-распределение с одной степенью свободы.

Как и все стабильные дистрибутивы, семья в масштабе местности которому принадлежит распределение Коши, замкнуто относительно линейные преобразования с настоящий коэффициенты. Кроме того, распределение Коши замкнуто относительно дробно-линейные преобразования с действительными коэффициентами.[11] В этой связи см. Также Параметризация распределений Коши Маккаллахом.

Характеристическая функция

Позволять обозначают распределенную случайную величину Коши. В характеристическая функция распределения Коши задается формулой

что просто преобразование Фурье плотности вероятности. Первоначальная плотность вероятности может быть выражена через характеристическую функцию, по существу, с помощью обратного преобразования Фурье:

В п-й момент распределения - это п-я производная характеристической функции, вычисленной при . Обратите внимание, что характеристическая функция не дифференцируемый в начале координат: это соответствует тому факту, что распределение Коши не имеет четко определенных моментов, превышающих нулевой момент.

Объяснение неопределенных моментов

Иметь в виду

Если распределение вероятностей имеет функция плотности , то среднее значение, если оно существует, определяется выражением

Мы можем оценить это двустороннее несобственный интеграл путем вычисления суммы двух односторонних несобственных интегралов. То есть,

для произвольного действительного числа .

Чтобы интеграл существовал (даже как бесконечное значение), хотя бы один из членов этой суммы должен быть конечным или оба должны быть бесконечными и иметь один и тот же знак. Но в случае распределения Коши оба члена в этой сумме (2) бесконечны и имеют противоположный знак. Следовательно, (1) не определено, как и среднее значение.[12]

Обратите внимание, что Главное значение Коши среднего распределения Коши равно

который равен нулю. С другой стороны, соответствующий интеграл

является нет нулю, что легко увидеть, вычислив интеграл. Это снова показывает, что среднее (1) не может существовать.

Различные результаты теории вероятностей о ожидаемые значения, такой как сильный закон больших чисел, не выполняются для распределения Коши.[12]

Меньшие моменты

Абсолютные моменты для определены. у нас есть

Высшие моменты

Распределение Коши не имеет конечных моментов любого порядка. Некоторые из высших сырые моменты существуют и имеют значение бесконечности, например необработанный второй момент:

Изменив формулу, можно увидеть, что второй момент - это, по сути, бесконечный интеграл от константы (здесь 1). Более высокие даже мощные необработанные моменты также будут оцениваться до бесконечности. Однако сырые моменты с нечетной силой не определены, что заметно отличается от существующих со значением бесконечности. Необработанные моменты с нечетной мощностью не определены, потому что их значения по существу эквивалентны так как две половины интеграла расходятся и имеют противоположные знаки. Первый необработанный момент - это среднее значение, которого, как ни странно, не существует. (См. Также обсуждение этого вопроса выше.) Это, в свою очередь, означает, что все центральные моменты и стандартизированные моменты не определены, поскольку все они основаны на среднем значении. Дисперсия - которая является вторым центральным моментом - также не существует (несмотря на то, что необработанный второй момент существует со значением бесконечность).

Результаты для высших моментов следуют из Неравенство Гёльдера, что означает, что более высокие моменты (или половины моментов) расходятся, если более низкие.

Моменты усеченных распределений

Рассмотрим усеченное распределение определяется ограничением стандартного распределения Коши интервалом [−10100, 10100]. У такого усеченного распределения есть все моменты (и центральная предельная теорема применима для i.i.d. наблюдения с него); однако почти для всех практических целей оно ведет себя как распределение Коши.[13]

Оценка параметров

Поскольку параметры распределения Коши не соответствуют среднему значению и дисперсии, попытка оценить параметры распределения Коши с использованием выборочного среднего и выборочной дисперсии не увенчается успехом.[14] Например, если i.i.d. образец размера п берется из распределения Коши, можно рассчитать выборочное среднее как:

Хотя примерные значения будет сосредоточено вокруг центральной ценности , среднее значение выборки будет становиться все более изменчивым по мере увеличения количества наблюдений из-за увеличения вероятности обнаружения точек выборки с большим абсолютным значением. Фактически, распределение выборочного среднего будет равно распределению самих наблюдений; т.е. выборочное среднее большой выборки не лучше (или хуже) оценки чем любое отдельное наблюдение из выборки. Точно так же расчет дисперсии выборки приведет к тому, что значения будут расти по мере увеличения количества наблюдений.

Следовательно, более надежные средства оценки центрального значения и параметр масштабирования необходимы. Один из простых способов - взять медианное значение выборки в качестве оценки и половина образца межквартильный размах как оценщик . Были разработаны другие, более точные и надежные методы. [15][16] Например, усеченное среднее из средних 24% выборки статистика заказов дает оценку для это более эффективно, чем использование медианы выборки или полного среднего значения выборки.[17][18] Однако из-за толстые хвосты распределения Коши, эффективность оценки снижается, если используется более 24% выборки.[17][18]

Максимальная вероятность также может использоваться для оценки параметров и . Однако это имеет тенденцию усложняться тем фактом, что для этого требуется найти корни многочлена высокой степени, и может быть несколько корней, которые представляют локальные максимумы.[19] Кроме того, хотя оценка максимального правдоподобия является асимптотически эффективной, она относительно неэффективна для небольших выборок.[20][21] Функция логарифмического правдоподобия для распределения Коши для размера выборки является:

Максимизация функции правдоподобия журнала относительно и дает следующую систему уравнений:

Обратите внимание, что

является монотонной функцией в и что решение должен удовлетворить

Решение только для требует решения полинома степени ,[19] и решение только для требует решения полинома степени . Следовательно, независимо от того, решая ли для одного параметра или для обоих параметров одновременно, числовой решение на компьютере обычно требуется. Преимущество оценки максимального правдоподобия - асимптотическая эффективность; оценка использование медианы выборки составляет лишь около 81% асимптотической эффективности, чем оценка по максимальной вероятности.[18][22] Усеченное среднее значение выборки с использованием статистики среднего порядка 24% составляет около 88% как асимптотически эффективная оценка как оценка максимального правдоподобия.[18] Когда Метод Ньютона используется для поиска решения для оценки максимального правдоподобия, средняя статистика порядка 24% может использоваться в качестве начального решения для .

Форму можно оценить с помощью медианы абсолютных значений, поскольку для местоположения 0 переменные Коши , то параметр формы.

Многомерное распределение Коши

А случайный вектор называется многомерным распределением Коши, если любая линейная комбинация его компонентов имеет распределение Коши. То есть для любого постоянного вектора , случайная величина должно иметь одномерное распределение Коши.[23] Характеристическая функция многомерного распределения Коши определяется выражением:

куда и настоящие функции с а однородная функция первой степени и положительная однородная функция первой степени.[23] Более формально:[23]

для всех .

Пример двумерного распределения Коши может быть дан следующим образом:[24]

Обратите внимание, что в этом примере, даже если нет аналога ковариационной матрицы, и не статистически независимый.[24]

Мы также можем написать эту формулу для комплексной переменной. Тогда функция плотности вероятности сложного Коши:

Как и одномерная плотность, многомерная плотность Коши также связана с многомерное распределение Стьюдента. Они эквивалентны, когда параметр степеней свободы равен единице. Плотность Размерность Распределение Стьюдента с одной степенью свободы принимает вид:

Свойства и подробности этой плотности можно получить, рассматривая ее как частный случай многомерной плотности Стьюдента.

Свойства трансформации

  • Если тогда [25]
  • Если и независимы, то и
  • Если тогда
  • Параметризация распределений Коши Маккаллахом:[26] Выражение распределения Коши через один комплексный параметр , определять значить . Если тогда:

куда , , и настоящие числа.

  • Используя то же соглашение, что и выше, если тогда:[26]
куда это круговое распределение Коши.

Мера Леви

Распределение Коши - это стабильное распространение индекса 1. Представление Леви – Хинчина такого устойчивого распределения параметра дается, для к:

куда

и можно выразить явно.[27] В случае распределения Коши имеем .

Это последнее представление является следствием формулы

Связанные дистрибутивы

  • Студенты т распределение
  • нестандартизированный студенческий т распределение
  • Если независимый, тогда
  • Если тогда
  • Если тогда
  • Если тогда
  • Распределение Коши является предельным случаем Распределение Пирсона типа 4[нужна цитата ]
  • Распределение Коши - это частный случай Распределение Пирсона типа 7.[1]
  • Распределение Коши - это стабильное распространение: если , тогда .
  • Распределение Коши является сингулярным пределом гиперболическое распределение[нужна цитата ]
  • В обернутое распределение Коши, принимая значения на окружности, получается из распределения Коши путем обертывания его по окружности.
  • Если , , тогда . Для половинных распределений Коши соотношение выполняется, если положить .

Релятивистское распределение Брейта – Вигнера

В ядерный и физика элементарных частиц, энергетический профиль резонанс описывается релятивистское распределение Брейта – Вигнера, а распределение Коши - это (нерелятивистское) распределение Брейта – Вигнера.[нужна цитата ]

Возникновение и приложения

  • Приложения распределения Коши или его преобразования можно найти в областях, работающих с экспоненциальным ростом. Статья Уайта 1958 года [29] вывели тестовую статистику для оценок для уравнения и где оценка максимального правдоподобия находится с использованием обычных наименьших квадратов, показано, что выборочное распределение статистики является распределением Коши.
Подгонянное кумулятивное распределение Коши к максимальным однодневным осадкам с использованием CumFreq, смотрите также распределительная арматура [30]
  • Распределение Коши часто представляет собой распределение наблюдений за вращающимися объектами. Классическая ссылка на это называется проблемой маяка Чайки.[31] и, как в предыдущем разделе, как распределение Брейта – Вигнера в физике элементарных частиц.

Смотрите также

Рекомендации

  1. ^ а б c Н. Л. Джонсон; С. Коц; Н. Балакришнан (1994). Непрерывные одномерные распределения, Том 1. Нью-Йорк: Вили.CS1 maint: ref = harv (связь), Глава 16.
  2. ^ Коши и ведьма из Аньези в Статистика в таблице, S M Stigler Harvard 1999 Глава 18
  3. ^ Феллер, Уильям (1971). Введение в теорию вероятностей и ее приложения, том II (2-е изд.). Нью-Йорк: John Wiley & Sons Inc., стр.704. ISBN  978-0-471-25709-7.
  4. ^ Райли, Кен Ф .; Хобсон, Майкл П .; Бенс, Стивен Дж. (2006). Математические методы для физики и инженерии (3-е изд.). Кембридж, Великобритания: Издательство Кембриджского университета. стр.1333. ISBN  978-0-511-16842-0.
  5. ^ Балакришнан, Н .; Неврозов, В. Б. (2003). Учебник по статистическим распределениям (1-е изд.). Хобокен, Нью-Джерси: John Wiley & Sons Inc., стр.305. ISBN  0-471-42798-5.
  6. ^ Васичек, Олдрих (1976). «Тест на нормальность, основанный на выборочной энтропии». Журнал Королевского статистического общества, серия B. 38 (1): 54–59.
  7. ^ Park, Sung Y .; Бера, Анил К. (2009). «Модель условной гетероскедастичности авторегрессии с максимальной энтропией» (PDF). Журнал эконометрики. Эльзевир. 150 (2): 219–230. Дои:10.1016 / j.jeconom.2008.12.014. Архивировано из оригинал (PDF) на 2011-09-30. Получено 2011-06-02.
  8. ^ Фредерик, Чизак; Нильсен, Франк (2019). «Формула в закрытой форме для расхождения Кульбака-Лейблера между распределениями Коши». arXiv:1905.10965. Bibcode:2019arXiv190510965C. Цитировать журнал требует | журнал = (помощь)
  9. ^ Пиллаи Н., Мэн X.L. (2016). «Неожиданная встреча с Коши и Леви». Анналы статистики. 44 (5): 2089–2097. arXiv:1505.01957. Дои:10.1214 / 15-AOS1407. S2CID  31582370.CS1 maint: использует параметр авторов (связь)
  10. ^ Кэмпбелл Б. Рид, Н. Балакришнан, Брани Видакович и Самуэль Котц (2006). Энциклопедия статистических наук (2-е изд.). Джон Уайли и сыновья. п. 778. ISBN  978-0-471-15044-2.CS1 maint: использует параметр авторов (связь)
  11. ^ Ф. Б. Найт (1976). «Характеристика типа Коши». Труды Американского математического общества. 55 (1): 130–135. Дои:10.2307/2041858. JSTOR  2041858.CS1 maint: ref = harv (связь)
  12. ^ а б "Распределение Коши". Виртуальные лаборатории. Университет Алабамы в Хантсвилле. Получено 19 сентября, 2018.
  13. ^ Хэмпел, Франк (1998), "Неужели статистика слишком сложна?" (PDF), Канадский статистический журнал, 26 (3): 497–513, Дои:10.2307/3315772, HDL:20.500.11850/145503, JSTOR  3315772.
  14. ^ Иллюстрация нестабильности выборочных средних
  15. ^ Кейн, Гвенда Дж. (1974). «Линейная оценка параметров распределения Коши на основе выборочных квантилей». Журнал Американской статистической ассоциации. 69 (345): 243–245. Дои:10.1080/01621459.1974.10480163. JSTOR  2285535.
  16. ^ Чжан, Цзинь (2010). «Высокоэффективная L-оценка для параметра местоположения распределения Коши». Вычислительная статистика. 25 (1): 97–105. Дои:10.1007 / s00180-009-0163-y. S2CID  123586208.
  17. ^ а б Ротенберг, Томас Дж .; Фишер, Франклин, М .; Тиланус, C.B. (1964). «Примечание об оценке по выборке Коши». Журнал Американской статистической ассоциации. 59 (306): 460–463. Дои:10.1080/01621459.1964.10482170.
  18. ^ а б c d Блох, Даниэль (1966). «Примечание об оценке параметров местоположения распределения Коши». Журнал Американской статистической ассоциации. 61 (316): 852–855. Дои:10.1080/01621459.1966.10480912. JSTOR  2282794.
  19. ^ а б Фергюсон, Томас С. (1978). «Оценки максимального правдоподобия параметров распределения Коши для выборок размера 3 и 4». Журнал Американской статистической ассоциации. 73 (361): 211–213. Дои:10.1080/01621459.1978.10480031. JSTOR  2286549.
  20. ^ Коэн Фрой, Габриэлла В. (2007). «Оценка Питмана параметра местоположения Коши» (PDF). Журнал статистического планирования и вывода. 137 (6): 1901. Дои:10.1016 / j.jspi.2006.05.002. Архивировано из оригинал (PDF) на 16.08.2011.
  21. ^ Уилкокс, Рэнд (2012). Введение в робастную оценку и проверку гипотез. Эльзевир.
  22. ^ Барнетт, В. Д. (1966). "Порядковые статистические оценщики расположения распределения Коши". Журнал Американской статистической ассоциации. 61 (316): 1205–1218. Дои:10.1080/01621459.1966.10482205. JSTOR  2283210.
  23. ^ а б c Фергюсон, Томас С. (1962). "Представление симметричного двумерного распределения Коши". Анналы математической статистики. 33 (4): 1256–1266. Дои:10.1214 / aoms / 1177704357. JSTOR  2237984. Получено 2017-01-07.
  24. ^ а б Моленбергс, Герт; Lesaffre, Эммануэль (1997). «Нелинейные интегральные уравнения для приближенных двумерных плотностей с заданными запасами и функцией зависимости» (PDF). Statistica Sinica. 7: 713–738. Архивировано из оригинал (PDF) на 14 сентября 2009 г.
  25. ^ Лимонс, Дон С. (2002), "Введение в стохастические процессы в физике", Американский журнал физики, Издательство Университета Джона Хопкинса, 71 (2): 35, Bibcode:2003AmJPh..71..191L, Дои:10.1119/1.1526134, ISBN  0-8018-6866-1
  26. ^ а б Маккаллах, П., «Условный вывод и модели Коши», Биометрика, том 79 (1992), страницы 247–259. PDF с домашней страницы McCullagh.
  27. ^ Киприану, Андреас (2009). Процессы Леви и ветвящиеся процессы с непрерывным состоянием: часть I (PDF). п. 11.CS1 maint: использует параметр авторов (связь)
  28. ^ Э. Хехт (1987). Оптика (2-е изд.). Эддисон-Уэсли. п. 603.
  29. ^ Уайт, Дж. (1958) Предельное распределение коэффициента последовательной корреляции во взрывоопасном случае. Анналы математической статистики, 29, 1188-1197.https://doi.org/10.1214/aoms/1177706450
  30. ^ CumFreq, бесплатное программное обеспечение для кумулятивного частотного анализа и подбора распределения вероятностей [1]
  31. ^ Чайка, С.Ф. (1988) Байесовский индуктивный вывод и максимальная энтропия. Kluwer Academic Publishers, Берлин. https://doi.org/10.1007/978-94-009-3049-0_4
  32. ^ Тонг Лю (2012), Промежуточное распределение между распределениями Гаусса и Коши. https://arxiv.org/pdf/1208.5109.pdf

внешняя ссылка