Пробит - Probit

График пробит-функции

В теория вероятности и статистика, то пробит функция - это квантильная функция связанный со стандартом нормальное распределение, который обычно обозначается как N (0,1). Математически это обратное кумулятивная функция распределения стандартного нормального распределения, которое обозначается как , поэтому пробит обозначается как . Он имеет приложения в исследовательские статистические графики и специализированные регрессионное моделирование переменных двоичного ответа.

Во многом из-за Центральная предельная теорема, стандартное нормальное распределение играет фундаментальную роль в теории вероятностей и статистике. Если мы рассмотрим знакомый факт, что стандартное нормальное распределение помещает 95% вероятности между -1,96 и 1,96 и симметрично относительно нуля, из этого следует, что

Функция пробит дает «обратное» вычисление, генерируя значение случайной переменной N (0,1), связанной с указанной кумулятивной вероятностью. Продолжая пример,

.

В целом,

и

Концептуальная разработка

Идея пробит-функции была опубликована Честер Иттнер Блисс в статье 1934 г. Наука о том, как обрабатывать такие данные, как процент вредителей, убитых пестицид.[1] Блисс предложила преобразовать процент убитых в "проблемаспособность unЭто"(или" пробит "), которое было линейно связано с современным определением (он произвольно определил его как равное 0 для 0,0001 и 1 для 0,9999). Он включил таблицу, чтобы помочь другим исследователям преобразовать их процент убийств в его пробит, который Затем они могли построить график против логарифма дозы и тем самым, как предполагалось, получить более или менее прямую линию. Такая так называемая пробит модель по-прежнему важен в токсикологии, а также в других областях. Такой подход оправдан, в частности, если вариацию отклика можно рационализировать как логнормальный распределение толерантности среди испытуемых на тесте, где толерантность конкретного испытуемого - это доза, ровно достаточная для интересующей реакции.

Метод, предложенный Блиссом, был продолжен в Пробит Анализ, важный текст по токсикологическому применению Д. Дж. Финни.[2][3] Значения, представленные Финни, могут быть получены из вероятностей, как определено здесь, путем добавления значения 5. Это различие резюмировано Коллеттом (стр. 55):[4] "Первоначальное определение пробит [с добавлением 5] было в первую очередь для того, чтобы избежать работы с отрицательными пробитами; ... Это определение все еще используется в некоторых кварталах, но в основных пакетах статистического программного обеспечения для того, что называется пробит анализ, вероятности определяются без добавления 5. "Следует отметить, что пробит-методология, включая численную оптимизацию для подбора пробит-функций, была введена до широкого распространения электронных вычислений. При использовании таблиц было удобно иметь равномерно положительные вероятности. Общие области применения не требуют положительных пробитов.

Диагностика отклонения распределения от нормальности

В дополнение к обеспечению основы для важных типов регрессии, пробит-функция полезна в статистическом анализе для диагностики отклонения от нормы в соответствии с методом построения графиков Q-Q. Если набор данных на самом деле образец из нормальное распределение, график зависимости значений от их пробит-баллов будет приблизительно линейным. Специфические отклонения от нормы, такие как асимметрия, тяжелые хвосты, или же бимодальность может быть диагностирован на основании обнаружения конкретных отклонений от линейности. В то время как график Q-Q может использоваться для сравнения с любым семейством распределений (не только с нормальным), нормальный график Q-Q является относительно стандартной процедурой исследовательского анализа данных, потому что предположение о нормальности часто является отправной точкой для анализа.

Вычисление

CDF нормального распределения и обратное ему не доступны в закрытая форма, а вычисления требуют осторожного использования числовых процедур. Однако функции широко доступны в программном обеспечении для статистического и вероятностного моделирования, а также в электронных таблицах. В Майкрософт Эксель, например, пробит-функция доступна как norm.s.inv (p). В вычислительных средах, где численные реализации функция обратной ошибки доступны, пробит-функция может быть получена как

Примером является MATLAB, где доступна функция erfinv. Язык Mathematica реализует InverseErf. В других средах функция пробит напрямую реализуется, как показано в следующем сеансе в Язык программирования R.

> qnorm(0.025)[1] -1.959964> пнорм(-1.96)[1] 0.02499790

Подробную информацию о вычислении обратной функции ошибок можно найти на [1]. Вичура дает быстрый алгоритм вычисления пробит-функции до 16 знаков после запятой; это используется в R для генерации случайных величин для нормального распределения.[5]

Обыкновенное дифференциальное уравнение для пробит-функции

Другой способ расчета основан на формировании нелинейного обыкновенного дифференциального уравнения (ОДУ) для пробита в соответствии с методом Штейнбрехера и Шоу.[6] Сокращение пробит-функции как , ОДУ есть

куда - функция плотности вероятности ш.

В случае гауссиана:

Снова дифференцируя:

с центральными (начальными) условиями

Это уравнение может быть решено несколькими методами, включая классический подход степенных рядов. Исходя из этого, решения сколь угодно высокой точности могут быть получены на основе подхода Стейнбрехера к ряду для обратной функции ошибок. Решение степенного ряда дается

где коэффициенты удовлетворяют нелинейной рекуррентности

с . В таком виде соотношение в качестве .

Смотрите также

Сравнение функция logit с масштабированным пробитом (т.е. обратным CDF из нормальное распределение ), сравнивая против. , что делает уклоны одинаковыми в начале координат.

Тесно связана с пробит-функцией (и пробит модель ) являются логит функция и логит модель. Обратная логистическая функция дается выражением

Аналогично модели пробит, мы можем предположить, что такая величина линейно связана с набором предикторов, в результате чего логит модель, основа, в частности, логистическая регрессия модель, наиболее распространенная форма регрессивный анализ для категориальных данных ответа. В современной статистической практике пробит- и логит-регрессионные модели часто рассматриваются как случаи обобщенная линейная модель.

Смотрите также

Рекомендации

  1. ^ Bliss CI. (1934). «Метод пробитов». Наука. 79 (2037): 38–39. Дои:10.1126 / science.79.2037.38. JSTOR  1659792. PMID  17813446.
  2. ^ Финни, Д.Дж. (1947), Пробит Анализ. (1-е издание) Cambridge University Press, Кембридж, Великобритания.
  3. ^ Финни, Д.Дж. (1971). Пробит-анализ (3-е издание). Издательство Кембриджского университета, Кембридж, Великобритания. ISBN  0-521-08041-X. OCLC  174198382.
  4. ^ Коллетт, Д. (1991). Моделирование двоичных данных. Чепмен и Холл / CRC.
  5. ^ Вичура, М.Дж. (1988). «Алгоритм AS241: процентные точки нормального распределения». Прикладная статистика. Блэквелл Паблишинг. 37 (3): 477–484. Дои:10.2307/2347330. JSTOR  2347330.
  6. ^ Штайнбрехер, Г., Шоу, В.Т. (2008). «Квантильная механика». Европейский журнал прикладной математики. 19 (2): 87–112. Дои:10.1017 / S0956792508007341.CS1 maint: несколько имен: список авторов (связь)