Пробит - Probit

График пробит-функции

В теория вероятности и статистика, то пробит функция - это квантильная функция связанный со стандартом нормальное распределение, который обычно обозначается как N (0,1). Математически это обратное кумулятивная функция распределения стандартного нормального распределения, которое обозначается как ${ displaystyle Phi (z)}$ , поэтому пробит обозначается как ${ Displaystyle Phi ^ {- 1} (р)}$ . Он имеет приложения в исследовательские статистические графики и специализированные регрессионное моделирование переменных двоичного ответа.

Во многом из-за Центральная предельная теорема, стандартное нормальное распределение играет фундаментальную роль в теории вероятностей и статистике. Если мы рассмотрим знакомый факт, что стандартное нормальное распределение помещает 95% вероятности между -1,96 и 1,96 и симметрично относительно нуля, из этого следует, что

{ Displaystyle Phi (-1,96) = 0,025 = 1- Phi (1,96). , !}

Функция пробит дает «обратное» вычисление, генерируя значение случайной переменной N (0,1), связанной с указанной кумулятивной вероятностью. Продолжая пример,

{ displaystyle operatorname {probit} (0,025) = - 1,96 = - operatorname {probit} (0,975)}

.

В целом,

{ displaystyle Phi ( Operatorname {probit} (p)) = p}

и

{ displaystyle operatorname {probit} ( Phi (z)) = z.}

Концептуальная разработка

Идея пробит-функции была опубликована Честер Иттнер Блисс в статье 1934 г. Наука о том, как обрабатывать такие данные, как процент вредителей, убитых пестицид.^[1] Блисс предложила преобразовать процент убитых в "проблемаспособность unЭто"(или" пробит "), которое было линейно связано с современным определением (он произвольно определил его как равное 0 для 0,0001 и 1 для 0,9999). Он включил таблицу, чтобы помочь другим исследователям преобразовать их процент убийств в его пробит, который Затем они могли построить график против логарифма дозы и тем самым, как предполагалось, получить более или менее прямую линию. Такая так называемая пробит модель по-прежнему важен в токсикологии, а также в других областях. Такой подход оправдан, в частности, если вариацию отклика можно рационализировать как логнормальный распределение толерантности среди испытуемых на тесте, где толерантность конкретного испытуемого - это доза, ровно достаточная для интересующей реакции.

Метод, предложенный Блиссом, был продолжен в Пробит Анализ, важный текст по токсикологическому применению Д. Дж. Финни.^[2]^[3] Значения, представленные Финни, могут быть получены из вероятностей, как определено здесь, путем добавления значения 5. Это различие резюмировано Коллеттом (стр. 55):^[4] "Первоначальное определение пробит [с добавлением 5] было в первую очередь для того, чтобы избежать работы с отрицательными пробитами; ... Это определение все еще используется в некоторых кварталах, но в основных пакетах статистического программного обеспечения для того, что называется пробит анализ, вероятности определяются без добавления 5. "Следует отметить, что пробит-методология, включая численную оптимизацию для подбора пробит-функций, была введена до широкого распространения электронных вычислений. При использовании таблиц было удобно иметь равномерно положительные вероятности. Общие области применения не требуют положительных пробитов.

Диагностика отклонения распределения от нормальности

В дополнение к обеспечению основы для важных типов регрессии, пробит-функция полезна в статистическом анализе для диагностики отклонения от нормы в соответствии с методом построения графиков Q-Q. Если набор данных на самом деле образец из нормальное распределение, график зависимости значений от их пробит-баллов будет приблизительно линейным. Специфические отклонения от нормы, такие как асимметрия, тяжелые хвосты, или же бимодальность может быть диагностирован на основании обнаружения конкретных отклонений от линейности. В то время как график Q-Q может использоваться для сравнения с любым семейством распределений (не только с нормальным), нормальный график Q-Q является относительно стандартной процедурой исследовательского анализа данных, потому что предположение о нормальности часто является отправной точкой для анализа.

Вычисление

CDF нормального распределения и обратное ему не доступны в закрытая форма, а вычисления требуют осторожного использования числовых процедур. Однако функции широко доступны в программном обеспечении для статистического и вероятностного моделирования, а также в электронных таблицах. В Майкрософт Эксель, например, пробит-функция доступна как norm.s.inv (p). В вычислительных средах, где численные реализации функция обратной ошибки доступны, пробит-функция может быть получена как

{ displaystyle operatorname {probit} (p) = { sqrt {2}} , operatorname {erf} ^ {- 1} (2p-1).}

Примером является MATLAB, где доступна функция erfinv. Язык Mathematica реализует InverseErf. В других средах функция пробит напрямую реализуется, как показано в следующем сеансе в Язык программирования R.

> qnorm(0.025)[1] -1.959964> пнорм(-1.96)[1] 0.02499790

Подробную информацию о вычислении обратной функции ошибок можно найти на [1]. Вичура дает быстрый алгоритм вычисления пробит-функции до 16 знаков после запятой; это используется в R для генерации случайных величин для нормального распределения.^[5]

Обыкновенное дифференциальное уравнение для пробит-функции

Другой способ расчета основан на формировании нелинейного обыкновенного дифференциального уравнения (ОДУ) для пробита в соответствии с методом Штейнбрехера и Шоу.^[6] Сокращение пробит-функции как ${ Displaystyle ш (р)}$ , ОДУ есть

{ displaystyle { frac {dw} {dp}} = { frac {1} {f (w)}}}

куда ${ displaystyle f (w)}$ - функция плотности вероятности $ш$ .

В случае гауссиана:

{ displaystyle { frac {dw} {dp}} = { sqrt {2 pi}} e ^ { frac {w ^ {2}} {2}}}

Снова дифференцируя:

{ displaystyle { frac {d ^ {2} w} {dp ^ {2}}} = w left ({ frac {dw} {dp}} right) ^ {2}}

с центральными (начальными) условиями

{ Displaystyle ш влево (1/2 вправо) = 0,}

{ displaystyle w ' left (1/2 right) = { sqrt {2 pi}}.}

Это уравнение может быть решено несколькими методами, включая классический подход степенных рядов. Исходя из этого, решения сколь угодно высокой точности могут быть получены на основе подхода Стейнбрехера к ряду для обратной функции ошибок. Решение степенного ряда дается

{ displaystyle w (p) = { sqrt { frac { pi} {2}}} sum _ {k = 0} ^ { infty} { frac {d_ {k}} {(2k + 1 )}} (2p-1) ^ {(2k + 1)}}

где коэффициенты ${ displaystyle d_ {k}}$ удовлетворяют нелинейной рекуррентности

{ displaystyle d_ {k + 1} = { frac { pi} {4}} sum _ {j = 0} ^ {k} { frac {d_ {j} d_ {kj}} {(j + 1) (2j + 1)}}}

с ${ displaystyle d_ {0} = 1}$ . В таком виде соотношение ${ displaystyle d_ {k + 1} / d_ {k} rightarrow 1}$ в качестве ${ Displaystyle к rightarrow infty}$ .

Смотрите также

Сравнение функция logit с масштабированным пробитом (т.е. обратным CDF из нормальное распределение ), сравнивая

{ displaystyle operatorname {logit} (x)}

против.

{ Displaystyle Phi ^ {- 1} (х) / { sqrt { frac { pi} {8}}}}

, что делает уклоны одинаковыми в начале координат.

Тесно связана с пробит-функцией (и пробит модель ) являются логит функция и логит модель. Обратная логистическая функция дается выражением

{ displaystyle operatorname {logit} (p) = log left ({ frac {p} {1-p}} right).}

Аналогично модели пробит, мы можем предположить, что такая величина линейно связана с набором предикторов, в результате чего логит модель, основа, в частности, логистическая регрессия модель, наиболее распространенная форма регрессивный анализ для категориальных данных ответа. В современной статистической практике пробит- и логит-регрессионные модели часто рассматриваются как случаи обобщенная линейная модель.

Смотрите также

Компромисс ошибки обнаружения графики (DET-графики, альтернатива ROC)
Логистическая регрессия (также известная как модель logit)
Logit
Пробит модель
Полиномиальный пробит
График Q-Q
Непрерывная функция
Монотонная функция
Квантильная функция
Сигмовидная функция
Rankit анализ, также разработанный Честером Блиссом
Ридит скоринг

Пробит - Probit

Содержание

Концептуальная разработка

Диагностика отклонения распределения от нормальности

Вычисление

Обыкновенное дифференциальное уравнение для пробит-функции

Смотрите также

Смотрите также

Рекомендации