Сложенное нормальное распределение - Folded normal distribution

Функция плотности вероятности
Функция плотности вероятности для складчато-нормального распределения
μ=1, σ=1
Кумулятивная функция распределения
Кумулятивная функция распределения для нормального распределения
μ=1, σ=1
Параметрыμр   (место расположения )
σ2 > 0   (шкала )
ПоддерживатьИкс ∈ [0,∞)
PDF
CDF
Иметь в виду
Дисперсия

В сложенное нормальное распределение это распределение вероятностей связанный с нормальное распределение. Учитывая нормально распределенную случайную величину Икс с иметь в виду μ и отклонение σ2, то случайная переменная Y = |Икс| имеет сложенное нормальное распределение. Такой случай может возникнуть, если записывается только величина некоторой переменной, но не ее знак. Распределение называется «свернутым», потому что масса вероятности слева от Икс = 0 сворачивается взятием абсолютная величина. В физике теплопроводность, свернутое нормальное распределение является фундаментальным решением уравнение теплопроводности на полупространстве; это соответствует наличию идеального изолятора на гиперплоскость через происхождение.

Определения

Плотность

В функция плотности вероятности (PDF) определяется выражением

за Икс ≥ 0 и 0 везде. Альтернативная формулировка дается

,

где cosh - косинус Гиперболическая функция. Отсюда следует, что кумулятивная функция распределения (CDF) определяется по формуле:

за Икс ≥ 0, где erf () - функция ошибки. Это выражение сводится к CDF полунормальное распределение когда μ = 0.

Среднее значение сложенного распределения тогда

или же

куда это нормальная кумулятивная функция распределения:

Тогда дисперсия легко выражается через среднее значение:

Оба среднего (μ) и дисперсия (σ2) из Икс в исходном нормальном распределении можно интерпретировать как параметры расположения и масштаба Y в разложенном виде.

Характеристики

Режим

Режим распределения - это значение для которых плотность максимальна. Чтобы найти это значение, берем первую производную плотности по и установите его равным нулю. К сожалению, закрытой формы нет. Однако мы можем записать производную лучше и получить нелинейное уравнение

.

Цагрис и др. (2014) показали из численного исследования, что когда , максимум достигается, когда , и когда становится больше, чем , максимум приближается . Конечно, этого следовало ожидать, поскольку в этом случае свернутая нормаль сходится к нормальному распределению. Чтобы избежать проблем с отрицательными отклонениями, предлагается возведение параметра в степень. В качестве альтернативы вы можете добавить ограничение, например, если оптимизатор выберет отрицательную дисперсию, значение логарифмической вероятности будет NA или что-то очень маленькое.

Характеристическая функция и другие связанные функции

  • Характеристическая функция определяется выражением

.

  • Производящая функция момента определяется выражением

.

  • Кумулянтная производящая функция определяется выражением

.

  • Преобразование Лапласа дается формулой

.

  • Преобразование Фурье дается формулой

.

Связанные дистрибутивы

Статистические выводы

Оценка параметров

Есть несколько способов оценить параметры свернутой нормали. Все они по сути являются процедурой оценки максимального правдоподобия, но в некоторых случаях выполняется численная максимизация, тогда как в других случаях выполняется поиск корня уравнения. Логарифмическая вероятность сложенной нормали, когда образец размера доступен можно записать следующим образом

В R (язык программирования), используя пакет Rfast можно получить MLE очень быстро (команда foldnorm.mle). В качестве альтернативы команда оптим или же НЛМ подойдет этому распределению. Максимизировать легко, поскольку два параметра ( и ) вовлечены. Обратите внимание, что как положительные, так и отрицательные значения для приемлемы, так как принадлежит действительной строке чисел, следовательно, знак не важен, так как распределение симметрично относительно него. Следующий код написан на R

сложенный <- функция(у) {  ## y - вектор с положительными данными  п <- длина(у)  ## размер образца  sy2 <- сумма(у ^ 2)    Сэм <- функция(параграф, п, sy2) {      мне <- пункт [1]   ;   se <- exp( пункт [2] )      ж <-  - п/2 * бревно(2/число Пи/se) + п * мне ^ 2 / 2 / se +            sy2 / 2 / se - сумма( бревно( шиш( мне * у/se ) ) )      ж    }  мод <- оптим( c( иметь в виду(у), SD(у) ), п = п, sy2 = sy2, Сэм, контроль = список(максит = 2000) )  мод <- оптим( мод$номинал, Сэм, п = п, sy2 = sy2, контроль = список(максит = 20000) )  результат <- c( -мод$ценить, мод$номинал [1], exp(мод$номинал [2]) )  имена(результат) <- c("логарифм вероятности", "му", "сигма в квадрате")  результат}

Частные производные логарифма правдоподобия записываются как

.

Приравнивая первую частную производную логарифмической вероятности нулю, мы получаем хорошее соотношение

.

Обратите внимание, что у приведенного выше уравнения есть три решения: одно нулевое и еще два с противоположным знаком. Подставляя приведенное выше уравнение, в частную производную логарифмической вероятности w.r.t и приравняв его нулю, получим следующее выражение для дисперсии

,

это та же формула, что и в нормальное распределение. Главное отличие здесь в том, что и статистически не независимы. Вышеупомянутые отношения могут использоваться для получения оценок максимального правдоподобия эффективным рекурсивным способом. Начнем с начального значения для и находим положительный корень () последнего уравнения. Затем мы получаем обновленное значение . Процедура повторяется до тех пор, пока изменение значения логарифмической вероятности не станет незначительным. Еще один более простой и эффективный способ - выполнить алгоритм поиска. Запишем последнее уравнение более элегантно

.

Становится ясно, что оптимизация логарифмической вероятности по двум параметрам превратилась в корневой поиск функции. Это, конечно, идентично предыдущему корневому поиску. Цагрис и др. (2014) обнаружили, что у этого уравнения есть три корня для , т.е. есть три возможных значения которые удовлетворяют этому уравнению. В и , которые являются оценками максимального правдоподобия, и 0, что соответствует минимальному логарифмическому правдоподобию.

Смотрите также

Рекомендации

  • Цагрис, М .; Beneki, C .; Хассани, Х. (2014). «О сложенном нормальном распределении». Математика. 2 (1): 12–28. arXiv:1402.3559.
  • Леоне, Ноттингем, РБ, Нельсон Л.С. (1961). «Свернутое нормальное распределение». Технометрика. 3 (4): 543–550. Дои:10.2307/1266560. HDL:2027 / mdp.39015095248541. JSTOR  1266560.
  • Джонсон Н.Л. (1962). «Сложенное нормальное распределение: точность оценки по максимальному правдоподобию». Технометрика. 4 (2): 249–256. Дои:10.2307/1266622. JSTOR  1266622.
  • Нельсон LS (1980). «Свернутое нормальное распределение». J Qual Technol. 12 (4): 236–238.
  • Эландт RC (1961). «Сложенное нормальное распределение: два метода оценки параметров по моментам». Технометрика. 3 (4): 551–562. Дои:10.2307/1266561. JSTOR  1266561.
  • Лин PC (2005). «Применение обобщенного складчато-нормального распределения к мерам возможностей процесса». Int J Adv Manuf Technol. 26 (7–8): 825–830. Дои:10.1007 / s00170-003-2043-х.
  • Psarakis, S .; Панаретос, Дж. (1990). «Свернутое t-распределение». Коммуникации в статистике - теория и методы. 19 (7): 2717–2734.
  • Psarakis, S .; Панаретос, Дж. (2001). «О некоторых двумерных расширениях свернутого нормального и свернутого t-распределений». Журнал прикладной статистической науки. 10 (2): 119–136.
  • Чакраборти, А.К .; Мутуши, К. (2013). «О многомерном сложенном нормальном распределении». Санкхья Б. 75 (1): 1–15.

внешняя ссылка