Пробит - Probit
Эта статья может быть слишком техническим для большинства читателей, чтобы понять. Пожалуйста помогите улучшить это к Сделайте это понятным для неспециалистов, не снимая технических деталей. (Январь 2013) (Узнайте, как и когда удалить этот шаблон сообщения) |
В теория вероятности и статистика, то пробит функция - это квантильная функция связанный со стандартом нормальное распределение, который обычно обозначается как N (0,1). Математически это обратное кумулятивная функция распределения стандартного нормального распределения, которое обозначается как , поэтому пробит обозначается как . Он имеет приложения в исследовательские статистические графики и специализированные регрессионное моделирование переменных двоичного ответа.
Во многом из-за Центральная предельная теорема, стандартное нормальное распределение играет фундаментальную роль в теории вероятностей и статистике. Если мы рассмотрим знакомый факт, что стандартное нормальное распределение помещает 95% вероятности между -1,96 и 1,96 и симметрично относительно нуля, из этого следует, что
Функция пробит дает «обратное» вычисление, генерируя значение случайной переменной N (0,1), связанной с указанной кумулятивной вероятностью. Продолжая пример,
- .
В целом,
- и
Концептуальная разработка
Идея пробит-функции была опубликована Честер Иттнер Блисс в статье 1934 г. Наука о том, как обрабатывать такие данные, как процент вредителей, убитых пестицид.[1] Блисс предложила преобразовать процент убитых в "проблемаспособность unЭто"(или" пробит "), которое было линейно связано с современным определением (он произвольно определил его как равное 0 для 0,0001 и 1 для 0,9999). Он включил таблицу, чтобы помочь другим исследователям преобразовать их процент убийств в его пробит, который Затем они могли построить график против логарифма дозы и тем самым, как предполагалось, получить более или менее прямую линию. Такая так называемая пробит модель по-прежнему важен в токсикологии, а также в других областях. Такой подход оправдан, в частности, если вариацию отклика можно рационализировать как логнормальный распределение толерантности среди испытуемых на тесте, где толерантность конкретного испытуемого - это доза, ровно достаточная для интересующей реакции.
Метод, предложенный Блиссом, был продолжен в Пробит Анализ, важный текст по токсикологическому применению Д. Дж. Финни.[2][3] Значения, представленные Финни, могут быть получены из вероятностей, как определено здесь, путем добавления значения 5. Это различие резюмировано Коллеттом (стр. 55):[4] "Первоначальное определение пробит [с добавлением 5] было в первую очередь для того, чтобы избежать работы с отрицательными пробитами; ... Это определение все еще используется в некоторых кварталах, но в основных пакетах статистического программного обеспечения для того, что называется пробит анализ, вероятности определяются без добавления 5. "Следует отметить, что пробит-методология, включая численную оптимизацию для подбора пробит-функций, была введена до широкого распространения электронных вычислений. При использовании таблиц было удобно иметь равномерно положительные вероятности. Общие области применения не требуют положительных пробитов.
Диагностика отклонения распределения от нормальности
В дополнение к обеспечению основы для важных типов регрессии, пробит-функция полезна в статистическом анализе для диагностики отклонения от нормы в соответствии с методом построения графиков Q-Q. Если набор данных на самом деле образец из нормальное распределение, график зависимости значений от их пробит-баллов будет приблизительно линейным. Специфические отклонения от нормы, такие как асимметрия, тяжелые хвосты, или же бимодальность может быть диагностирован на основании обнаружения конкретных отклонений от линейности. В то время как график Q-Q может использоваться для сравнения с любым семейством распределений (не только с нормальным), нормальный график Q-Q является относительно стандартной процедурой исследовательского анализа данных, потому что предположение о нормальности часто является отправной точкой для анализа.
Вычисление
CDF нормального распределения и обратное ему не доступны в закрытая форма, а вычисления требуют осторожного использования числовых процедур. Однако функции широко доступны в программном обеспечении для статистического и вероятностного моделирования, а также в электронных таблицах. В Майкрософт Эксель, например, пробит-функция доступна как norm.s.inv (p). В вычислительных средах, где численные реализации функция обратной ошибки доступны, пробит-функция может быть получена как
Примером является MATLAB, где доступна функция erfinv. Язык Mathematica реализует InverseErf. В других средах функция пробит напрямую реализуется, как показано в следующем сеансе в Язык программирования R.
> qnorm(0.025)[1] -1.959964> пнорм(-1.96)[1] 0.02499790
Подробную информацию о вычислении обратной функции ошибок можно найти на [1]. Вичура дает быстрый алгоритм вычисления пробит-функции до 16 знаков после запятой; это используется в R для генерации случайных величин для нормального распределения.[5]
Обыкновенное дифференциальное уравнение для пробит-функции
Другой способ расчета основан на формировании нелинейного обыкновенного дифференциального уравнения (ОДУ) для пробита в соответствии с методом Штейнбрехера и Шоу.[6] Сокращение пробит-функции как , ОДУ есть
куда - функция плотности вероятности ш.
В случае гауссиана:
Снова дифференцируя:
с центральными (начальными) условиями
Это уравнение может быть решено несколькими методами, включая классический подход степенных рядов. Исходя из этого, решения сколь угодно высокой точности могут быть получены на основе подхода Стейнбрехера к ряду для обратной функции ошибок. Решение степенного ряда дается
где коэффициенты удовлетворяют нелинейной рекуррентности
с . В таком виде соотношение в качестве .
Смотрите также
Тесно связана с пробит-функцией (и пробит модель ) являются логит функция и логит модель. Обратная логистическая функция дается выражением
Аналогично модели пробит, мы можем предположить, что такая величина линейно связана с набором предикторов, в результате чего логит модель, основа, в частности, логистическая регрессия модель, наиболее распространенная форма регрессивный анализ для категориальных данных ответа. В современной статистической практике пробит- и логит-регрессионные модели часто рассматриваются как случаи обобщенная линейная модель.
Смотрите также
- Компромисс ошибки обнаружения графики (DET-графики, альтернатива ROC)
- Логистическая регрессия (также известная как модель logit)
- Logit
- Пробит модель
- Полиномиальный пробит
- График Q-Q
- Непрерывная функция
- Монотонная функция
- Квантильная функция
- Сигмовидная функция
- Rankit анализ, также разработанный Честером Блиссом
- Ридит скоринг
Рекомендации
- ^ Bliss CI. (1934). «Метод пробитов». Наука. 79 (2037): 38–39. Дои:10.1126 / science.79.2037.38. JSTOR 1659792. PMID 17813446.
- ^ Финни, Д.Дж. (1947), Пробит Анализ. (1-е издание) Cambridge University Press, Кембридж, Великобритания.
- ^ Финни, Д.Дж. (1971). Пробит-анализ (3-е издание). Издательство Кембриджского университета, Кембридж, Великобритания. ISBN 0-521-08041-X. OCLC 174198382.
- ^ Коллетт, Д. (1991). Моделирование двоичных данных. Чепмен и Холл / CRC.
- ^ Вичура, М.Дж. (1988). «Алгоритм AS241: процентные точки нормального распределения». Прикладная статистика. Блэквелл Паблишинг. 37 (3): 477–484. Дои:10.2307/2347330. JSTOR 2347330.
- ^ Штайнбрехер, Г., Шоу, В.Т. (2008). «Квантильная механика». Европейский журнал прикладной математики. 19 (2): 87–112. Дои:10.1017 / S0956792508007341.CS1 maint: несколько имен: список авторов (связь)