Отрицательное биномиальное распределение - Negative binomial distribution

В разных текстах (и даже в разных частях этой статьи) используются несколько разные определения отрицательного биномиального распределения. Их можно отличить по тому, начинается ли поддержка в k = 0 или при к = г, будь то п обозначает вероятность успеха или неудачи, а также р представляет успех или неудачу,[1] поэтому очень важно определить конкретную параметризацию, используемую в любом данном тексте.
Вероятностная функция масс
Negbinomial.gif
Оранжевая линия представляет собой среднее значение, равное 10 на каждом из этих графиков; зеленая линия показывает стандартное отклонение.
Обозначение
Параметрыр > 0 - количество отказов до остановки эксперимента (целое число, но определение также может быть расширено до реалы )
п ∈ [0,1] - вероятность успеха в каждом эксперименте (реальная)
Поддержкаk ∈ {0, 1, 2, 3,…} - количество успехов
PMF с участием биномиальный коэффициент
CDF то регуляризованная неполная бета-функция
Значить
Режим
Дисперсия
Асимметрия
Ex. эксцесс
MGF
CF
PGF
Информация Fisher
Метод моментов

В теория вероятности и статистика, то отрицательное биномиальное распределение это дискретное распределение вероятностей который моделирует количество успехов в последовательности независимых и одинаково распределенных Бернулли испытания перед указанным (неслучайным) количеством отказов (обозначенных р) происходит.[2] Например, мы можем определить бросок 6 на кубике как неудачу и бросок любого другого числа как успех, и спросить, сколько успешных бросков произойдет, прежде чем мы увидим третий провал (р = 3). В таком случае распределение вероятностей количества не-6, которые появятся, будет отрицательным биномиальным распределением.

В Распределение Паскаля (после Блез Паскаль ) и Распространение Polya (для Георгий Полиа ) являются частными случаями отрицательного биномиального распределения. Среди инженеров, климатологов и других существует соглашение об использовании «отрицательного бинома» или «Паскаля» для случая целочисленного параметра времени остановки. р, а в случае с действительными значениями - "Поля".

Для возникновения связанных дискретных событий, таких как вспышки торнадо, распределения Polya могут быть использованы для получения более точных моделей, чем распределение Пуассона позволяя среднему значению и дисперсии быть разными, в отличие от Пуассона. Отрицательное биномиальное распределение имеет дисперсию , причем распределение становится идентичным Пуассону в пределе для данного среднего . Это может сделать дистрибутив полезным чрезмерно диспергированный альтернатива распределению Пуассона, например для крепкий модификация Регрессия Пуассона. В эпидемиологии он использовался для моделирования передачи инфекционных заболеваний, где вероятное количество новых инфекций может значительно варьироваться от человека к человеку и от места к месту.[3] В более общем плане это может быть уместным, когда события имеют положительную корреляцию между происшествиями, вызывающими большую отклонение чем если бы события были независимыми, из-за положительного ковариация срок.

Термин «отрицательный бином», вероятно, связан с тем, что определенный биномиальный коэффициент который появляется в формуле для функция массы вероятности распределения можно записать проще с отрицательными числами.[4]

Определения

Предположим, что существует последовательность независимых Бернулли испытания. Таким образом, каждое испытание имеет два возможных результата, называемых «успех» и «неудача». В каждом испытании вероятность успеха составляет п а отказа - (1 -п). Мы наблюдаем эту последовательность до тех пор, пока не появится заранее заданное число р успехов. Тогда случайное количество отказов, которые мы видели, Икс, будет отрицательный бином (или Паскаль) распределение:

Применительно к проблемам реального мира результаты успех и неудача могут или не могут быть результатами, которые мы обычно рассматриваем как хорошие и плохие соответственно. Предположим, мы использовали отрицательное биномиальное распределение для моделирования количества дней, в течение которых определенная машина работает до того, как выйдет из строя. В этом случае «отказ» будет результатом того дня, когда машина работает нормально, а поломка - «успехом». Если бы мы использовали отрицательное биномиальное распределение для моделирования количества голов, которые спортсмен делает до того, как набрать очки р гола, то каждая неудачная попытка будет «провалом», а забитый гол будет «успехом». Если мы подбрасываем монету, то отрицательное биномиальное распределение может дать количество решек («неудач»), с которыми мы, вероятно, столкнемся, прежде чем встретим определенное количество решек («успехов»). В функции массы вероятности ниже п вероятность успеха, а (1 -п) - вероятность отказа.

Вероятностная функция масс

В функция массы вероятности отрицательного биномиального распределения

где р это количество успехов, k количество отказов, а п вероятность успеха. Здесь в скобках указано количество биномиальный коэффициент, и равно

Есть k неудачи, выбранные из к + г-1 образцы, а не к + г потому что последний из к + г образцы по определению успешны.

Эту величину можно также записать следующим образом, объясняя название «отрицательный бином»:

Обратите внимание, что по последнему выражению и биномиальный ряд, для каждого 0 ≤ п < 1 и ,

следовательно, члены вероятностной функции массы действительно составляют единицу, как показано ниже.

Чтобы понять приведенное выше определение функции массы вероятности, обратите внимание, что вероятность для каждой конкретной последовательности р успехов и k неудачи пр(1 − п)k, потому что результаты k + р испытания должны произойти независимо. Поскольку руспех всегда приходит последним, остается выбрать k испытаний с отказами из оставшихся k + р - 1 испытание. Вышеупомянутый биномиальный коэффициент, благодаря его комбинаторной интерпретации, дает точное количество всех этих последовательностей длины k + р − 1.

Кумулятивная функция распределения

В кумулятивная функция распределения можно выразить через регуляризованная неполная бета-функция:

Это также может быть выражено через кумулятивная функция распределения из биномиальное распределение:[5]

Альтернативные составы

Некоторые источники могут определять отрицательное биномиальное распределение немного иначе, чем здесь первичное. Наиболее распространены варианты, когда случайная величина Икс считает разные вещи. Эти варианты можно увидеть в таблице здесь:

Икс считает ...Вероятностная функция массФормулаАльтернативная формула

(с использованием эквивалентного бинома)

Альтернативная формула

(упрощено с использованием: )

Поддержка
1k неудачи, учитывая р успехи[6][7][8][9][10][11][12]
2п испытания, учитывая р успехи[7][12][13][14][15]
3п испытания, учитывая р неудачи
4р успехов, учитывая п испытанияЭто биномиальное распределение:

Каждое из этих определений отрицательного биномиального распределения может быть выражено несколько разными, но эквивалентными способами. Первая альтернативная формулировка - это просто эквивалентная форма биномиального коэффициента, а именно: . Вторая альтернативная формулировка несколько упрощает выражение, признавая, что общее количество испытаний - это просто количество успехов и неудач, то есть: . Эти вторые формулировки могут быть более интуитивными для понимания, однако они, возможно, менее практичны, поскольку содержат больше терминов.

  1. Определение где Икс это количество k неудачи которые происходят для данного количества р успехи. Это определение очень похоже на основное определение, используемое в этой статье, только k успехов и р отказы переключаются при рассмотрении того, что считается и что дано. Однако обратите внимание, что п по-прежнему относится к вероятности «успеха».
  2. Определение где Икс это количество п испытания которые происходят для данного количества р успехи. Это определение очень похоже на определение №2, только р успехи даны вместо k неудачи. Однако обратите внимание, что п по-прежнему относится к вероятности «успеха».
  • Определение отрицательного биномиального распределения может быть расширено до случая, когда параметр р может взять на себя положительный настоящий ценность. Хотя невозможно визуализировать нецелое число «отказов», мы все же можем формально определить распределение через его функцию массы вероятности. Проблема распространения определения на вещественные (положительные) р сводится к распространению биномиального коэффициента на его действительный аналог, основанный на гамма-функция:
Подставив это выражение в исходное определение, мы говорим, что Икс имеет отрицательный бином (или Pólya) распределение, если оно имеет функция массы вероятности:
Вот р это действительное положительное число.

При отрицательной биномиальной регрессии[16] распределение указывается в терминах его среднего, , который затем связан с независимыми переменными, как в линейная регрессия или другой обобщенные линейные модели. Из выражения для среднего м, можно вывести и . Затем, подставляя эти выражения в один для функции массы вероятности, когда р ценный, дает эту параметризацию функции масс вероятности черезм:

Тогда дисперсию можно записать как . Некоторые авторы предпочитают устанавливать , и выразим дисперсию как . В этом контексте и в зависимости от автора либо параметр р или его обратный α упоминается как «параметр дисперсии», «параметр формы» или «коэффициент кластеризации»,[17] или "неоднородность"[16] или параметр "агрегация".[11] Термин «агрегация» особенно используется в экологии при описании количества отдельных организмов. Уменьшение параметра агрегации р к нулю соответствует возрастающей агрегации организмов; увеличение в р к бесконечности соответствует отсутствию агрегации, что можно описать как Регрессия Пуассона.

  • Иногда распределение параметризуется в терминах его среднего μ и дисперсия σ2:

Примеры

Продажа конфет

Пэт Коллис должен продавать шоколадные батончики, чтобы собрать деньги на экскурсию в шестом классе. По соседству тридцать домов, и Пэт не должен возвращаться домой, пока не будут проданы пять шоколадных батончиков. Итак, ребенок ходит от двери к двери, продавая шоколадные батончики. В каждом доме вероятность продать один шоколадный батончик составляет 0,6, а ничего не продать - 0,4.

Какова вероятность продать последний моноблок на пth жилой дом?

Наш критерий остановки - это успешная продажа конфет достаточное количество раз (в отличие от неспособности продать их), поэтому k в данном случае представляет собой количество отказов и р представляет количество успехов. Напомним, что NegBin (р, п) распределение описывает вероятность k неудачи и р успехи в k + р Бернулли (п) испытания с успехом на последнем испытании. Продать пять шоколадных батончиков - значит получить пять успехов. Таким образом, количество испытаний (т. Е. Домов) составляет k + 5 = п. Интересующая нас случайная величина - это количество домов, поэтому подставляем k = п - 5 в функцию масс NegBin (5, 0.4) и получим следующую функцию масс распределения домов (для п ≥ 5):

Какова вероятность того, что Пэт финиширует в десятом доме?

Какова вероятность того, что Пэт закончит работу в восьмом доме или раньше?

Чтобы закончить в восьмом доме или раньше, Пат должен закончить в пятом, шестом, седьмом или восьмом доме. Суммируйте эти вероятности:

Какова вероятность того, что Пэт вымотает все 30 домов по соседству?

Это можно выразить как вероятность того, что Pat не закончить с пятого по тридцатый дома:

Из-за довольно высокой вероятности того, что Пэт будет продавать каждый дом (60 процентов), вероятность того, что она НЕ выполнит свой квест, исчезающе мала.

Продолжительность пребывания в больнице

Больница продолжительность пребывания является примером реальных данных, которые можно хорошо смоделировать с помощью отрицательного биномиального распределения.[18]

Свойства

Ожидание

Ожидаемое общее количество успехов в отрицательном биномиальном распределении с параметрами (р, п) является rp/(1 − п). Чтобы убедиться в этом, представьте, что эксперимент по моделированию отрицательного бинома выполняется много раз. То есть проводится набор испытаний до тех пор, пока р получены отказы, затем еще одна серия испытаний, затем еще одна и т. д. Запишите количество испытаний, выполненных в каждом эксперименте: а, б, c, … и установить а + б + c + … = N. Теперь мы ожидаем около Np успехов в целом. Скажем, эксперимент был проведен п раз. Тогда есть номер сбои в целом. Итак, мы ожидали номер = N(1 − п), так N/пр/(1 − п). Видеть, что N/п - это просто среднее количество испытаний за эксперимент. Вот что мы подразумеваем под «ожиданием». Среднее количество успехов на эксперимент составляет N/п − рр/(1 − п) − р = rp/(1 − п). Это соответствует среднему значению, указанному в поле в правой части этой страницы.

Дисперсия

При подсчете количества успехов учитывается число р отказов дисперсия составляетrp/(1 − п)2.При подсчете количества отказов до р-й успех, дисперсияр(1 − п)/п2.

Связь с биномиальной теоремой

Предположим Y случайная величина с биномиальное распределение с параметрами п и п. Предполагать п + q = 1, с пq ≥ 0, то

С помощью Биномиальная теорема Ньютона, это также можно записать как:

в котором верхняя грань суммирования бесконечна. В этом случае биномиальный коэффициент

определяется, когда п является действительным числом, а не просто положительным целым числом. Но в нашем случае биномиального распределения он равен нулю, когда k > п. Тогда мы можем сказать, например,

Теперь предположим р > 0, и мы используем отрицательную экспоненту:

Тогда все члены положительны, и член

это просто вероятность того, что количество отказов до рй успех равен k, предоставлена р целое число. (Если р является отрицательным нецелым числом, поэтому показатель степени является положительным нецелым числом, тогда некоторые из членов в сумме выше отрицательны, поэтому у нас нет распределения вероятностей на множестве всех неотрицательных целых чисел.)

Теперь мы также допускаем нецелочисленные значения р. Тогда у нас есть собственное отрицательное биномиальное распределение, которое является обобщением распределения Паскаля, которое совпадает с распределением Паскаля, когда р оказывается целым положительным числом.

Напомним, что

Сумма независимых отрицательно-биномиально распределенных случайных величин р1 и р2 с тем же значением параметра п отрицательно-биномиально распределена с тем же п но с р-ценностьр1 + р2.

Это свойство сохраняется, когда определение обобщается таким образом, и дает быстрый способ увидеть, что отрицательное биномиальное распределение равно бесконечно делимый.

Отношение рецидива

Следующее отношение повторения держит:

Связанные дистрибутивы

распределение Пуассона

Рассмотрим последовательность отрицательных биномиальных случайных величин, в которой параметр остановки р стремится к бесконечности, тогда как вероятность успеха в каждом испытании пстремится к нулю таким образом, чтобы среднее значение распределения оставалось постоянным. Обозначая это средство как λ, параметр п будет п = λ/(р + λ)

При такой параметризации функция массы вероятности будет

Теперь, если мы рассмотрим предел как р → ∞, второй множитель будет сходиться к единице, а третий - к показательной функции:

которая является функцией масс Распределенный по Пуассону случайная величина с ожидаемым значениемλ.

Другими словами, альтернативно параметризованное отрицательное биномиальное распределение сходится распределению Пуассона и р контролирует отклонение от Пуассона. Это делает отрицательное биномиальное распределение подходящим в качестве надежной альтернативы Пуассону, который приближается к Пуассону для больших р, но имеющий большую дисперсию, чем Пуассон для малых р.

Гамма-пуассоновская смесь

Отрицательное биномиальное распределение также возникает как непрерывная смесь Распределения Пуассона (т.е. сложное распределение вероятностей ) где перемешивающее распределение скорости Пуассона есть гамма-распределение. То есть мы можем рассматривать отрицательный бином как Пуассон (λ) распределение, где λ сама по себе является случайной величиной, распределенной как гамма-распределение с shape = р и масштабировать θ = п/(1 − п) или соответственно оценить β = (1 − п)/п.

Чтобы продемонстрировать интуицию, стоящую за этим утверждением, рассмотрим два независимых процесса Пуассона, «Успех» и «Неудача», с интенсивностями п и 1 -п. Вместе процессы успеха и неудачи эквивалентны одному пуассоновскому процессу с интенсивностью 1, где возникновение процесса считается успехом, если соответствующее независимое подбрасывание монеты с вероятностью выпадает орлом. п; в противном случае это неудача. Если р - это счетное число, подбрасывания монеты показывают, что количество успехов перед р-й сбой следует отрицательному биномиальному распределению с параметрами р и п. Однако счет также является счетом процесса Пуассона успеха в случайное время. Т из рое вхождение в пуассоновском процессе отказа. Счетчик успехов следует распределению Пуассона со средним pT, где Т время ожидания для р вхождения в пуассоновский процесс интенсивности 1 -п, т.е. Т гамма-распределение с параметром формы р и интенсивность 1 -п. Таким образом, отрицательное биномиальное распределение эквивалентно распределению Пуассона со средним значением pT, где случайная величина Т гамма-распределение с параметром формы р и интенсивность (1 − п)/п. Предыдущий абзац следует, потому что λ = pT гамма-распределение с параметром формы р и интенсивность (1 − п)/п.

Следующий формальный вывод (не зависящий от р будучи счетным числом) подтверждает интуицию.

Из-за этого отрицательное биномиальное распределение также известно как гамма – пуассоновское (смесь) распределение. Отрицательное биномиальное распределение первоначально было получено как предельный случай гамма-распределения Пуассона.[19]

Распределение суммы геометрически распределенных случайных величин

Если Yр - случайная величина, подчиняющаяся отрицательному биномиальному распределению с параметрами р и п, и поддержка {0, 1, 2, ...}, затем Yр это сумма р независимый переменные, следующие за геометрическое распределение (на {0, 1, 2, ...}) с параметром п. В результате Центральная предельная теорема, Yр (правильно масштабировано и смещено) поэтому приблизительно нормальный для достаточно большогор.

Кроме того, если Bs+р случайная величина, следующая за биномиальное распределение с параметрами s + р и 1 -п, тогда

В этом смысле отрицательное биномиальное распределение является «обратным» биномиальному распределению.

Сумма независимых отрицательно-биномиально распределенных случайных величин р1 и р2 с тем же значением параметра п отрицательно-биномиально распределена с тем же п но с р-ценностьр1 + р2.

Отрицательное биномиальное распределение равно бесконечно делимый, т.е. если Y имеет отрицательное биномиальное распределение, то для любого положительного целого числа п, существуют независимые одинаково распределенные случайные величины Y1, ..., Yп сумма которого имеет то же распределение, что и Y есть.

Представление в виде составного распределения Пуассона

Отрицательное биномиальное распределение NB (р,п) можно представить как составное распределение Пуассона: Позволять {Yп, п ∈ ℕ0} обозначают последовательность независимые и одинаково распределенные случайные величины, каждый из которых логарифмическое распределение Журнал(п), с функцией массы вероятности

Позволять N быть случайной величиной, независимый последовательности, и предположим, что N имеет распределение Пуассона со средним λ = -р ln (1 - п). Тогда случайная сумма

это NB (р,п) -распределены. Чтобы доказать это, вычислим функция, производящая вероятность гИкс из Икс, который представляет собой композицию функций, производящих вероятность гN и гY1. С помощью

и

мы получаем

которая является вероятностной производящей функцией NB (р,п) распространение.

В следующей таблице описаны четыре распределения, связанных с количеством успехов в последовательности розыгрышей:

С заменамиНикаких замен
Учитывая количество розыгрышейбиномиальное распределениегипергеометрическое распределение
Заданное количество отказовотрицательное биномиальное распределениеотрицательное гипергеометрическое распределение

(a, b, 0) класс распределений

Отрицательное биномиальное распределение, наряду с распределением Пуассона и биномиальным распределением, является членом (a, b, 0) класс распределений. Все три этих распределения являются частными случаями Распределение Panjer. Они также являются членами Естественная экспоненциальная семья.

Статистические выводы

Оценка параметров

MVUE для п

Предположим п неизвестно, и проводится эксперимент, в котором заранее решено, что отбор проб будет продолжаться до тех пор, пока р успехи найдены. А достаточная статистика для эксперимента k, количество отказов.

При оценке п, то несмещенная оценка минимальной дисперсии является

Оценка максимального правдоподобия

В максимальная вероятность оценка п является

но это предвзятая оценка. Его обратное (р + k)/р, является несмещенной оценкой 1 /п, Однако.[20]

Оценщик максимального правдоподобия существует только для выборок, для которых выборочная дисперсия больше, чем выборочное среднее.[21] Функция правдоподобия для N iid наблюдения (k1, ..., kN) является

из которого мы вычисляем функцию логарифма правдоподобия

Чтобы найти максимум, возьмем частные производные по р и п и установите их равными нулю:

и

где

это функция дигаммы.

Решая первое уравнение для п дает:

Подстановка этого во второе уравнение дает:

Это уравнение не может быть решено для р в закрытая форма. Если требуется численное решение, итерационный метод, такой как Метод Ньютона может быть использован. В качестве альтернативы алгоритм ожидания – максимизации может быть использован.[21]

Возникновение и приложения

Время ожидания в процессе Бернулли

Для особого случая, когда р является целым числом, отрицательное биномиальное распределение известно как Распределение Паскаля. Это распределение вероятностей определенного количества неудач и успехов в серии независимые и одинаково распределенные Судебные процессы Бернулли. Для k + р Бернулли испытания с вероятностью успеха п, отрицательный бином дает вероятность k успехов и р неудачи, с неудачей на последнем испытании. Другими словами, отрицательное биномиальное распределение - это распределение вероятностей количества успехов до рй провал в Процесс Бернулли, с вероятностью п успехов на каждом испытании. Процесс Бернулли - это дискретный времени, поэтому количество попыток, неудач и успехов - целые числа.

Рассмотрим следующий пример. Предположим, мы несколько раз бросаем кубик и считаем 1 "неудачей". Вероятность успеха в каждом испытании - 5/6. Количество успехов до третьей неудачи принадлежит бесконечному множеству {0, 1, 2, 3, ...}. Это количество успехов является случайной величиной с отрицательным биномиальным распределением.

Когда р = 1 мы получаем распределение вероятностей количества успехов до первого отказа (т.е. вероятность того, что первый отказ произойдет на (k + 1) -я проба), что является геометрическое распределение:

Сверхдисперсный Пуассон

Отрицательное биномиальное распределение, особенно в его альтернативной параметризации, описанной выше, можно использовать в качестве альтернативы распределению Пуассона. Это особенно полезно для дискретных данных в неограниченном положительном диапазоне, выборка которых отклонение превышает образец значить. В таких случаях наблюдения чрезмерно диспергированный относительно распределения Пуассона, для которого среднее значение равно дисперсии. Следовательно, распределение Пуассона не является подходящей моделью. Поскольку отрицательное биномиальное распределение имеет на один параметр больше, чем Пуассон, второй параметр можно использовать для корректировки дисперсии независимо от среднего. Увидеть Кумулянты некоторых дискретных распределений вероятностей.

Применение этого - к ежегодным подсчетам тропические циклоны в Североатлантический или к ежемесячному до 6-месячного учета зимнего времени внетропические циклоны по Европе, для которого дисперсия больше среднего.[22][23][24] В случае небольшой избыточной дисперсии это может дать результаты, по существу аналогичные сверхдисперсному распределению Пуассона.[25][26]

Отрицательное биномиальное распределение также обычно используется для моделирования данных в виде подсчетов считывания дискретных последовательностей из высокопроизводительных экспериментов по секвенированию РНК и ДНК.[27][28][29]

История

Это распределение было впервые изучено в 1713 году Монмортом как распределение количества испытаний, необходимых в эксперименте для достижения заданного количества успехов.[30] Ранее об этом упоминал Паскаль.[31]

Смотрите также

использованная литература

  1. ^ ДеГрут, Моррис Х. (1986). вероятность и статистика (Второе изд.). Эддисон-Уэсли. С. 258–259. ISBN  0-201-11366-X. LCCN  84006269. OCLC  10605205.
  2. ^ Вайсштейн, Эрик. «Отрицательное биномиальное распределение». Вольфрам MathWorld. Wolfram Research. Получено 11 октября 2020.
  3. ^ например: J.O. Ллойд-Смит, С.Дж. Шрайбер, П. Копп, В. Getz (2005), Сверхраспространение и влияние индивидуальных особенностей на возникновение болезни, Природа, 438, 355–359. Дои:10.1038 / природа04153
    Параметр сверхдисперсии обычно обозначают буквой в эпидемиологии, а не как здесь.
  4. ^ Казелла, Джордж; Бергер, Роджер Л. (2002). Статистические выводы (2-е изд.). Томсон обучения. п.95. ISBN  0-534-24312-6.
  5. ^ Моррис К. В. (1963), Заметка о прямом и обратном отборе проб, Биометрика, 50, 544-545.
  6. ^ "Mathworks: отрицательное биномиальное распределение".
  7. ^ а б Кук, Джон Д. «Заметки об отрицательном биномиальном распределении» (PDF).
  8. ^ Саха, Абхишек. «Введение в вероятность / Основы теории вероятностей: лекция 14» (PDF).
  9. ^ В., Вайсштейн, Эрик. «Отрицательное биномиальное распределение». mathworld.wolfram.com.
  10. ^ Институт САС, "Отрицательное биномиальное распределение ", SAS (R) 9.4 Функции и процедуры CALL: Справочник, четвертое издание, Институт SAS, Кэри, Северная Каролина, 2016 г.
  11. ^ а б Кроули, Майкл Дж. (2012). Книга R. Вайли. ISBN  978-1-118-44896-0.
  12. ^ а б «Теория множеств: Раздел 3.2.5 - Отрицательное биномиальное распределение» (PDF).
  13. ^ "Randomservices.org, Глава 10: Испытания Бернулли, Раздел 4: Отрицательное биномиальное распределение".
  14. ^ "Stat Trek: отрицательное биномиальное распределение".
  15. ^ Рутон, Жаклин. «Различение биномиального, гипергеометрического и отрицательного биномиального распределений» (PDF).
  16. ^ а б Хильбе, Джозеф М. (2011). Отрицательная биномиальная регрессия (Второе изд.). Кембридж, Великобритания: Издательство Кембриджского университета. ISBN  978-0-521-19815-8.
  17. ^ Ллойд-Смит, Дж. О. (2007). «Оценка максимального правдоподобия отрицательного параметра биномиальной дисперсии для сильно диспергированных данных с применением к инфекционным заболеваниям». PLoS ONE. 2 (2): e180. Bibcode:2007PLoSO ... 2..180L. Дои:10.1371 / journal.pone.0000180. ЧВК  1791715. PMID  17299582. открытый доступ
  18. ^ Картер, Э.М., Поттс, Х.В.В. (4 апреля 2014 г.). «Прогнозирование продолжительности пребывания в больнице из электронной системы истории болезни: пример первичной полной замены коленного сустава». BMC Медицинская информатика и принятие решений. 14: 26. Дои:10.1186/1472-6947-14-26. ЧВК  3992140. PMID  24708853.CS1 maint: несколько имен: список авторов (ссылка на сайт) открытый доступ
  19. ^ Greenwood, M .; Юл, Г. У. (1920). «Исследование природы частотных распределений, характерных для множественных событий, с особым упором на множественные приступы болезни или повторяющиеся несчастные случаи». J R Stat Soc. 83 (2): 255–279. Дои:10.2307/2341080. JSTOR  2341080.
  20. ^ Холдейн, Дж. Б. С. (1945). «О методе оценки частот». Биометрика. 33 (3): 222–225. Дои:10.1093 / biomet / 33.3.222. HDL:10338.dmlcz / 102575. JSTOR  2332299. PMID  21006837.
  21. ^ а б Арамидис, К. (1999). «Алгоритм EM для оценки отрицательных биномиальных параметров». Статистический журнал Австралии и Новой Зеландии. 41 (2): 213–221. Дои:10.1111 / 1467-842X.00075.
  22. ^ Villarini, G .; Vecchi, G.A .; Смит, Дж. (2010). «Моделирование зависимости количества тропических штормов в Североатлантическом бассейне от климатических показателей». Ежемесячный обзор погоды. 138 (7): 2681–2705. Bibcode:2010MWRv..138.2681V. Дои:10.1175 / 2010MWR3315.1.
  23. ^ Mailier, P.J .; Стивенсон, Д. Б.; Ferro, C.A.T .; Ходжес, К. (2006). «Последовательная кластеризация внетропических циклонов». Ежемесячный обзор погоды. 134 (8): 2224–2240. Bibcode:2006MWRv..134.2224M. Дои:10.1175 / MWR3160.1.
  24. ^ Vitolo, R .; Стивенсон, Д. Б.; Повар, Ян М .; Митчелл-Уоллес, К. (2009). «Последовательная группировка сильных европейских штормов». Meteorologische Zeitschrift. 18 (4): 411–424. Bibcode:2009MetZe..18..411V. Дои:10.1127/0941-2948/2009/0393. S2CID  67845213.
  25. ^ Маккаллах, Питер; Нелдер, Джон (1989). Обобщенные линейные модели (Второе изд.). Бока-Ратон: Чепмен и Холл / CRC. ISBN  978-0-412-31760-6.
  26. ^ Кэмерон, Адриан Ч .; Триведи, Правин К. (1998). Регрессионный анализ данных подсчета. Издательство Кембриджского университета. ISBN  978-0-521-63567-7.
  27. ^ Робинсон, доктор медицины; Смит, Г.К. (2007). «Модерируемые статистические тесты для оценки различий в количестве меток». Биоинформатика. 23 (21): 2881–2887. Дои:10.1093 / биоинформатика / btm453. PMID  17881408.
  28. ^ С любовью, Майкл; Андерс, Саймон (14 октября 2014 г.). «Дифференциальный анализ данных счета - пакет DESeq2» (PDF). Получено 14 октября, 2014.
  29. ^ Чен, Юньшунь; Дэвис, Маккарти (25 сентября 2014 г.). «edgeR: анализ дифференциальной экспрессии цифровых данных экспрессии генов» (PDF). Получено 14 октября, 2014.
  30. ^ Montmort PR de (1713) Essai d'analyse sur les jeux de hasard. 2nd изд. Кийо, Париж
  31. ^ Паскаль B (1679) Varia Opera Mathematica. Д. Петри де Ферма. Толосы