Центральная предельная теорема - Central limit theorem

В теория вероятности, то Центральная предельная теорема (CLT) устанавливает, что во многих ситуациях, когда независимые случайные величины добавлены, их правильно нормализованный сумма стремится к нормальное распределение (неофициально кривая колокола), даже если сами исходные переменные не имеют нормального распределения. Теорема является ключевым понятием в теории вероятностей, потому что из нее следует, что вероятностные и статистический методы, которые работают для нормальных распределений, могут быть применимы ко многим задачам, связанным с другими типами распределений.

Если находятся случайные выборки каждый размер взяты из популяции с общим иметь в виду и конечный отклонение и если это выборочное среднее, предельная форма распределения в качестве , - стандартное нормальное распределение.[1]

Например, предположим, что образец получается содержащий много наблюдения, каждое наблюдение генерируется случайным образом, не зависящим от значений других наблюдений, и что среднее арифметическое из наблюдаемых значений вычисляется. Если эта процедура выполняется много раз, центральная предельная теорема утверждает, что распределение вероятностей среднего будет близко аппроксимировать нормальное распределение. Простой пример: если один подбрасывает монетку много раз, вероятность получить заданное количество орлов будет приближаться к нормальному распределению со средним значением, равным половине общего числа подбрасываний. На пределе бесконечного числа флипов это будет нормальное распределение.

Центральная предельная теорема имеет несколько вариантов. В общем виде случайные величины должны быть одинаково распределены. В вариантах сходимость среднего к нормальному распределению также происходит для неидентичных распределений или для независимых наблюдений, если они соответствуют определенным условиям.

Самая ранняя версия этой теоремы о том, что нормальное распределение может использоваться как приближение к биномиальное распределение, это Теорема де Муавра – Лапласа.

Независимые последовательности

Распределение "сглаживается" суммирование, показывая оригинал плотность распределения и три последующих суммирования; видеть Иллюстрация центральной предельной теоремы для получения дополнительной информации.
Какой бы ни была форма распределения населения, выборочное распределение стремится к гауссову, а его дисперсия задается центральной предельной теоремой.[2]

Классический CLT

Позволять быть случайный пример размера - то есть последовательность независимые и одинаково распределенные (i.i.d.) случайные величины, взятые из распределения ожидаемое значение данный и конечный отклонение данный . Предположим, нас интересует среднее значение выборки

этих случайных величин. Посредством закон больших чисел, выборка усредняет сходятся почти наверняка (а значит, и сходятся по вероятности ) к ожидаемому значению в качестве . Классическая центральная предельная теорема описывает размер и форму распределения стохастических флуктуаций вокруг детерминированного числа во время этого сближения. Точнее, в нем говорится, что как становится больше, распределение разницы между выборочным средним и его предел , при умножении на множитель (то есть ), аппроксимирует нормальное распределение со средним 0 и дисперсией . Для достаточно больших п, распределение близка к нормальному распределению со средним и дисперсия . Полезность теоремы заключается в том, что распределение приближается к нормальности независимо от формы распределения особи . Формально теорему можно сформулировать следующим образом:

Линдеберг – Леви CLT. Предполагать это последовательность i.i.d. случайные величины с и . Тогда как стремится к бесконечности, случайные величины сходиться в распределении к нормальный :[3]

В случае , сходимость по распределению означает, что кумулятивные функции распределения из поточечно сходятся к cdf распределение: для каждого действительного числа,

куда стандартный нормальный cdf, оцениваемый на. Сходимость равномерная по в том смысле, что

куда обозначает наименьшую верхнюю границу (или супремум ) набора.[4]

Ляпунов ЦЛТ

Теорема названа в честь русского математика. Александр Ляпунов. В этом варианте центральной предельной теоремы случайные величины должны быть независимыми, но не обязательно одинаково распределенными. Теорема также требует, чтобы случайные величины имеют моменты некоторого порядка , и что скорость роста этих моментов ограничивается приведенным ниже условием Ляпунова.

Ляпунов ЦЛТ.[5] Предполагать представляет собой последовательность независимых случайных величин, каждая из которых имеет конечное ожидаемое значение и дисперсия . Определять

Если для некоторых , Состояние Ляпунова

выполняется, то сумма сходится по распределению к стандартной нормальной случайной величине, как уходит в бесконечность:

На практике обычно проще всего проверить условие Ляпунова на .

Если последовательность случайных величин удовлетворяет условию Ляпунова, то она также удовлетворяет условию Линдеберга. Однако обратное утверждение неверно.

Lindeberg CLT

В той же постановке и с теми же обозначениями, что и выше, условие Ляпунова можно заменить следующим более слабым (из Lindeberg в 1920 г.).

Предположим, что для каждого

куда это индикаторная функция. Тогда распределение стандартизированных сумм

сходится к стандартному нормальному распределению .

Многомерный CLT

Доказательства, использующие характеристические функции, могут быть распространены на случаи, когда каждый отдельный это случайный вектор в , со средним вектором и ковариационная матрица (среди компонентов вектора), и эти случайные векторы независимы и одинаково распределены. Суммирование этих векторов производится покомпонентно. Многомерная центральная предельная теорема утверждает, что при масштабировании суммы сходятся к многомерное нормальное распределение.[6]

Позволять

быть k-вектор. Жирный в означает, что это случайный вектор, а не случайная (одномерная) величина. Тогда сумма случайных векторов будет

и в среднем

и поэтому

Многомерная центральная предельная теорема утверждает, что

где ковариационная матрица равно

Скорость сходимости определяется следующим Берри – Эссеен введите результат:

Теорема.[7] Позволять быть независимым -значные случайные векторы, каждый из которых имеет нулевое среднее значение. Написать и предполагать обратимо. Позволять быть -мерный гауссовский с той же матрицей среднего и ковариационной . Тогда для всех выпуклых множеств ,

куда - универсальная постоянная, , и обозначает евклидову норму на .

Неизвестно, был ли фактор необходимо.[8]

Обобщенная теорема

Центральная предельная теорема утверждает, что сумма ряда независимых и одинаково распределенных случайных величин с конечной дисперсией будет стремиться к нормальное распределение по мере роста числа переменных. Обобщение из-за Гнеденко и Колмогоров утверждает, что сумма ряда случайных величин со степенным хвостом (Паретийский хвост ) распределения, убывающие как куда (и, следовательно, имеющий бесконечную дисперсию) будет стремиться к стабильному распределению по мере роста числа слагаемых.[9][10] Если тогда сумма сходится к стабильное распространение с параметром устойчивости равным 2, т. е. распределением Гаусса.[11]

Зависимые процессы

CLT при слабой зависимости

Полезным обобщением последовательности независимых одинаково распределенных случайных величин является смешивание случайный процесс в дискретном времени; «смешивание» означает, грубо говоря, что случайные величины, удаленные друг от друга во времени, почти независимы. В эргодической теории и теории вероятностей используется несколько видов перемешивания. Особенно сильное перемешивание (также называемое α-перемешиванием), определяемое куда так называемый сильный коэффициент смешивания.

Упрощенная формулировка центральной предельной теоремы при сильном перемешивании:[12]

Теорема. Предположим, что стационарный и -смешивание с и это и . Обозначить , то предел

существует, и если тогда сходится по распределению к .

Фактически,

где ряд абсолютно сходится.

Предположение не может быть опущен, так как асимптотическая нормальность не выполняется для куда другой стационарная последовательность.

Есть более сильная версия теоремы:[13] предположение заменяется на , а предположение заменяется на

Существование таких обеспечивает заключение. Энциклопедический анализ предельных теорем в условиях перемешивания см. В (Брэдли 2007 ).

Разница по мартингейлу CLT

Теорема. Пусть мартингейл удовлетворить

  • по вероятности как п → ∞,
  • для каждого ε > 0, в качестве п → ∞,

тогда сходится по распределению к в качестве .[14][15]

Осторожность: В ограниченное ожидание[требуется разъяснение ] не следует путать с условным ожиданием .

Замечания

Доказательство классической CLT

Центральная предельная теорема имеет доказательство с использованием характеристические функции.[16] Это похоже на доказательство (слабого) закон больших чисел.

Предполагать являются независимыми и одинаково распределенными случайными величинами, каждая со средним и конечная дисперсия . Сумма имеет иметь в виду и отклонение . Рассмотрим случайную величину

где на последнем шаге мы определили новые случайные величины , каждый с нулевым средним и единичной дисперсией (). В характеристическая функция из дан кем-то

где на последнем шаге мы использовали тот факт, что все одинаково распределены. Характеристическая функция является по Теорема Тейлора,

куда является "маленький о обозначение "для некоторой функции который стремится к нулю быстрее, чем . В пределах экспоненциальная функция () характеристическая функция равно

Все члены высшего порядка исчезают в пределе . Правая часть равна характеристической функции стандартного нормального распределения. , что подразумевает через Теорема Леви о непрерывности что распределение подойдет в качестве . Следовательно среднее значение выборки

таково, что

сходится к нормальному распределению , из которой следует центральная предельная теорема.

Сходимость до предела

Центральная предельная теорема дает только асимптотическое распределение. В качестве приближения для конечного числа наблюдений оно обеспечивает разумное приближение только тогда, когда оно близко к пику нормального распределения; требуется очень большое количество наблюдений, чтобы простираться до хвоста.[нужна цитата ]

Сходимость в центральной предельной теореме равна униформа потому что предельная кумулятивная функция распределения непрерывна. Если третий центральный момент существует и конечна, то скорость сходимости не менее порядка (видеть Теорема Берри – Эссеена ). Метод Штейна[17] может использоваться не только для доказательства центральной предельной теоремы, но и для получения оценок скорости сходимости для выбранных метрик.[18]

Сходимость к нормальному распределению монотонна в том смысле, что энтропия из увеличивается монотонно к нормальному распределению.[19]

Центральная предельная теорема применима, в частности, к суммам независимых и одинаково распределенных дискретные случайные величины. Сумма дискретные случайные величины все еще дискретная случайная величина, так что перед нами последовательность дискретные случайные величины чья кумулятивная функция распределения вероятностей сходится к кумулятивной функции распределения вероятностей, соответствующей непрерывной переменной (а именно функции нормальное распределение ). Это означает, что если мы построим гистограмма реализации суммы п независимых идентичных дискретных переменных, кривая, соединяющая центры верхних граней прямоугольников, образующих гистограмму, сходится к гауссовой кривой как п стремится к бесконечности, это отношение известно как Теорема де Муавра – Лапласа. В биномиальное распределение В статье подробно описывается такое применение центральной предельной теоремы в простом случае дискретной переменной, принимающей только два возможных значения.

Связь с законом больших чисел

Закон больших чисел а также центральная предельная теорема являются частными решениями общей проблемы: «Каково предельное поведение Sп в качестве п приближается к бесконечности? »В математическом анализе асимптотический ряд являются одним из самых популярных инструментов, используемых для решения таких вопросов.

Предположим, у нас есть асимптотическое разложение :

Разделив обе части на φ1(п) и взятие лимита произведет а1, коэффициент перед членом высшего порядка в разложении, который представляет скорость, с которой ж(п) изменения в его ведущем члене.

Неформально можно сказать: "ж(п) растет примерно как а1φ1(п)". Принимая во внимание разницу между ж(п) и его приближение, а затем деление на следующий член в разложении, мы приходим к более тонкому утверждению о ж(п):

Здесь можно сказать, что разница между функцией и ее приближением растет примерно как а2φ2(п). Идея состоит в том, что разделение функции на соответствующие нормализующие функции и рассмотрение ограничивающего поведения результата может многое рассказать нам об ограничивающем поведении самой исходной функции.

Неформально что-то подобное происходит, когда сумма, Sп, независимых одинаково распределенных случайных величин, Икс1, …, Иксп, изучается в классической теории вероятностей.[нужна цитата ] Если каждый Икся имеет конечное среднее μ, то по закону больших чисел Sп/пμ.[20] Если вдобавок каждый Икся имеет конечную дисперсию σ2, то по центральной предельной теореме

куда ξ распространяется как N(0,σ2). Это обеспечивает значения первых двух констант в неформальном расширении

В случае, если Икся не имеют конечного среднего или дисперсии, сходимость сдвинутой и масштабированной суммы также может происходить с различными коэффициентами центрирования и масштабирования:

или неофициально

Распределения Ξ которые могут возникнуть таким образом, называются стабильный.[21] Ясно, что нормальное распределение стабильно, но есть и другие стабильные распределения, такие как Распределение Коши, для которых не определены среднее значение или дисперсия. Коэффициент масштабирования бп может быть пропорционально пc, для любого c1/2; его также можно умножить на медленно меняющаяся функция из п.[11][22]

В закон повторного логарифма указывает, что происходит "между" закон больших чисел и центральная предельная теорема. В частности, в нем говорится, что нормализующая функция п журнал журнал п, средний размер между п закона больших чисел и п центральной предельной теоремы, обеспечивает нетривиальное предельное поведение.

Альтернативные формулировки теоремы

Функции плотности

В плотность суммы двух или более независимых переменных составляет свертка их плотностей (если эти плотности существуют). Таким образом, центральную предельную теорему можно интерпретировать как утверждение о свойствах функций плотности при свертке: свертка ряда функций плотности стремится к нормальной плотности, когда число функций плотности неограниченно увеличивается. Эти теоремы требуют более сильных гипотез, чем приведенные выше формы центральной предельной теоремы. Теоремы этого типа часто называют локальными предельными теоремами. См Петрова[23] для конкретной локальной предельной теоремы для сумм независимые и одинаково распределенные случайные величины.

Характерные функции

Поскольку характеристическая функция свертки является произведением характеристических функций задействованных плотностей, центральная предельная теорема имеет еще одну переформулировку: произведение характеристических функций ряда функций плотности становится близким к характеристической функции нормальной плотности как количество функция плотности неограниченно возрастает при указанных выше условиях. В частности, к аргументу характеристической функции должен применяться соответствующий коэффициент масштабирования.

Аналогичное заявление можно сделать о Преобразования Фурье, поскольку характеристическая функция по существу является преобразованием Фурье.

Расчет дисперсии

Позволять Sп быть суммой п случайные переменные. Многие центральные предельные теоремы содержат такие условия, что Sп/Вар (Sп) сходится по распределению к N(0,1) (нормальное распределение со средним 0, дисперсией 1) как п→ ∞. В некоторых случаях можно найти постоянную σ2 и функция f (n) такой, что Sп/ (σnf(п)) сходится по распределению к N(0,1) в качестве п→ ∞.

Лемма.[24] Предполагать представляет собой последовательность действительных и строго стационарных случайных величин с для всех , , и . Построить

  1. Если абсолютно сходится, , и тогда в качестве куда .
  2. Если вдобавок и сходится по распределению к в качестве тогда также сходится по распределению к в качестве .

Расширения

Произведения положительных случайных величин

В логарифм продукта - это просто сумма логарифмов факторов. Следовательно, когда логарифм произведения случайных величин, принимающих только положительные значения, приближается к нормальному распределению, само произведение приближается к логнормальное распределение. Многие физические величины (особенно масса или длина, которые зависят от масштаба и не могут быть отрицательными) являются продуктами различных случайный факторов, поэтому они следуют логнормальному распределению. Эту мультипликативную версию центральной предельной теоремы иногда называют Закон гибрата.

В то время как центральная предельная теорема для сумм случайных величин требует условия конечной дисперсии, соответствующая теорема для произведений требует соответствующего условия, что функция плотности интегрируема с квадратом.[25]

За пределами классических рамок

Асимптотическая нормальность, то есть конвергенция к нормальному распределению после соответствующего сдвига и масштабирования, это явление гораздо более общее, чем классическая структура, рассмотренная выше, а именно, суммы независимых случайных величин (или векторов). Время от времени появляются новые рамки; единой объединяющей основы пока нет.

Выпуклое тело

Теорема. Существует последовательность εп ↓ 0 для которого справедливо следующее. Позволять п ≥ 1, и пусть случайные величины Икс1, …, Иксп есть бревенчатый плотность стыков ж такой, что ж(Икс1, …, Иксп) = ж(|Икс1|, …, |Иксп|) для всех Икс1, …, Иксп, и E (Икс2
k
) = 1
для всех k = 1, …, п. Тогда распределение

является εп-рядом с N(0,1) в общее расстояние вариации.[26]

Эти двое εп-ближайшие распределения имеют плотности (фактически, логарифмически вогнутые плотности), таким образом, полное расстояние дисперсии между ними является интегралом от абсолютного значения разницы между плотностями. Сходимость при полной вариации сильнее слабой.

Важным примером логарифмически вогнутой плотности является функция, постоянная внутри данного выпуклого тела и исчезающая снаружи; оно соответствует равномерному распределению на выпуклом теле, что объясняет термин «центральная предельная теорема для выпуклых тел».

Другой пример: ж(Икс1, …, Иксп) = const · exp (- (|Икс1|α + … + |Иксп|α)β) куда α > 1 и αβ > 1. Если β = 1 тогда ж(Икс1, …, Иксп) разлагается на const · exp (- |Икс1|α)… Exp (- |Иксп|α), что значит Икс1, …, Иксп независимы. Но в целом они зависимы.

Условие ж(Икс1, …, Иксп) = ж(|Икс1|, …, |Иксп|) гарантирует, что Икс1, …, Иксп имеют нулевое среднее и некоррелированный;[нужна цитата ] тем не менее, они не должны быть независимыми, или даже попарно независимые.[нужна цитата ] Кстати, попарная независимость не может заменить независимость в классической центральной предельной теореме.[27]

Вот Берри – Эссеен введите результат.

Теорема. Позволять Икс1, …, Иксп удовлетворяют условиям предыдущей теоремы, то [28]

для всех а < б; здесь C это универсальная (абсолютная) постоянная. Причем для каждого c1, …, cп такой, что c2
1
+ … + c2
п
= 1
,

Распределение Икс1 + … + Иксп/п не обязательно быть приблизительно нормальным (фактически, может быть однородным).[29] Однако распределение c1Икс1 + … + cпИксп близко к N(0,1) (в общем расстоянии вариации) для большинства векторов (c1, …, cп) по равномерному распределению на сфере c2
1
+ … + c2
п
= 1
.

Лакунарный тригонометрический ряд

Теорема (СалемЗигмунд ): Позволять U - случайная величина, равномерно распределенная на (0,2π), и Иксk = рk cos (пkU + аk), куда

  • пk удовлетворяют условию лакунарности: существует q > 1 такой, что пk + 1qnk для всех k,
  • рk такие, что
  • 0 ≤ аk <2π.

потом[30][31]

сходится по распределению к N(0, 1/2).

Гауссовы многогранники

Теорема: Позволять А1, …, Ап быть независимыми случайными точками на плоскости 2 каждая имеет двумерное стандартное нормальное распределение. Позволять Kп быть выпуклый корпус этих точек, и Иксп площадь Kп потом[32]

сходится по распределению к N(0,1) в качестве п стремится к бесконечности.

То же самое верно и для всех измерений больше 2.

В многогранник Kп называется гауссовским случайным многогранником.

Аналогичный результат справедлив для числа вершин (многогранника Гаусса), числа ребер и фактически граней всех размерностей.[33]

Линейные функции ортогональных матриц

Линейная функция матрицы M - линейная комбинация его элементов (с заданными коэффициентами), M ↦ tr (ЯВЛЯЮСЬ) куда А - матрица коэффициентов; видеть След (линейная алгебра) # Внутренний продукт.

Случайный ортогональная матрица называется распределенным равномерно, если его распределение является нормированным Мера Хаара на ортогональная группа O (п,); видеть Матрица вращения # Матрицы равномерного случайного вращения.

Теорема. Позволять M быть случайным ортогональным п × п матрица распределена равномерно, и А фиксированный п × п матрица такая, что tr (AA*) = п, и разреши Икс = tr (ЯВЛЯЮСЬ). потом[34] распределение Икс близко к N(0,1) в метрике общей вариации до[требуется разъяснение ] 23/п − 1.

Подпоследовательности

Теорема. Пусть случайные величины Икс1, Икс2, … ∈ L2(Ом) быть таким, чтобы Иксп → 0 слабо в L2(Ом) и Икс
п
→ 1
слабо в L1(Ом). Тогда существуют целые числа п1 < п2 < … такой, что

сходится по распределению к N(0,1) в качестве k стремится к бесконечности.[35]

Случайное блуждание по кристаллической решетке

Центральная предельная теорема может быть установлена ​​для простого случайная прогулка на кристаллической решетке (бесконечный абелев накрывающий граф над конечным графом) и используется для проектирования кристаллических структур.[36][37]

Приложения и примеры

Простой пример

Этот рисунок демонстрирует центральную предельную теорему. Средние выборки генерируются с использованием генератора случайных чисел, который извлекает числа от 0 до 100 из равномерного распределения вероятностей. Это показывает, что увеличение размеров выборки приводит к тому, что 500 измеренных выборочных средних более близко распределяются относительно среднего по генеральной совокупности (в данном случае 50). Он также сравнивает наблюдаемые распределения с распределениями, которые можно было бы ожидать для нормализованного распределения Гаусса, и показывает хи-квадрат значения, которые количественно определяют качество подгонки (подгонка хороша, если хи-квадрат значение меньше или приблизительно равно единице). Входными данными в нормализованную функцию Гаусса является среднее значение выборки (~ 50) и среднее стандартное отклонение выборки, деленное на квадратный корень из размера выборки (~ 28,87 /п), которое называется стандартным отклонением среднего (поскольку оно относится к разбросу выборочных средних).

Простой пример центральной предельной теоремы - бросание множества одинаковых несмещенных игральных костей. Распределение суммы (или среднего) выпавших чисел будет хорошо аппроксимировано нормальным распределением. Поскольку реальные величины часто являются сбалансированной суммой многих ненаблюдаемых случайных событий, центральная предельная теорема также дает частичное объяснение преобладания нормального распределения вероятностей. Это также оправдывает приближение большой выборки статистика к нормальному распределению в контролируемых экспериментах.

Сравнение функций плотности вероятности, **п(k) на сумму п справедливые 6-сторонние игральные кости, чтобы показать их сходимость к нормальному распределению с увеличением п, согласно центральной предельной теореме. На нижнем правом графике сглаженные профили предыдущих графиков масштабируются, накладываются друг на друга и сравниваются с нормальным распределением (черная кривая).
Еще одно моделирование с использованием биномиального распределения. Были сгенерированы случайные 0 и 1, а затем рассчитаны их средние для размеров выборки от 1 до 512. Обратите внимание, что по мере увеличения размера выборки хвосты становятся тоньше, а распределение становится более концентрированным вокруг среднего.

Реальные приложения

Опубликованная литература содержит ряд полезных и интересных примеров и приложений, относящихся к центральной предельной теореме.[38] Один источник[39] приводит следующие примеры:

  • Распределение вероятностей для общего расстояния, пройденного за случайная прогулка (предвзятый или непредвзятый) будет склонен к нормальное распределение.
  • Подбрасывание большого количества монет приведет к нормальному распределению общего количества решек (или, что эквивалентно, общего количества решек).

С другой стороны, центральная предельная теорема объясняет обычное появление «колоколообразной кривой» в оценки плотности применяется к данным реального мира. В таких случаях, как электронный шум, экзаменационные оценки и т. Д., Мы часто можем рассматривать одно измеренное значение как средневзвешенное значение множества небольших эффектов. Затем, используя обобщения центральной предельной теоремы, мы можем увидеть, что это часто (хотя и не всегда) приводит к окончательному распределению, которое приблизительно нормально.

В общем, чем больше измерение похоже на сумму независимых переменных с равным влиянием на результат, тем более нормальным оно является. Это оправдывает обычное использование этого распределения для замены эффектов ненаблюдаемых переменных в таких моделях, как линейная модель.

Регресс

Регрессивный анализ и в частности обыкновенный метод наименьших квадратов указывает, что зависимая переменная зависит в зависимости от функции от одного или нескольких независимые переменные, с добавкой срок ошибки. Различные типы статистического вывода о регрессии предполагают, что член ошибки имеет нормальное распределение. Это предположение может быть оправдано, если предположить, что член ошибки на самом деле является суммой многих независимых членов ошибки; даже если отдельные члены ошибок не распределены нормально, по центральной предельной теореме их сумма может быть хорошо аппроксимирована нормальным распределением.

Другие иллюстрации

Учитывая его важность для статистики, доступен ряд статей и компьютерных пакетов, демонстрирующих сходимость, заложенную в центральной предельной теореме.[40]

История

Голландский математик Хенк Таймс пишет:[41]

Центральная предельная теорема имеет интересную историю. Первая версия этой теоремы была сформулирована математиком французского происхождения. Абрахам де Муавр который в замечательной статье, опубликованной в 1733 году, использовал нормальное распределение для аппроксимации распределения числа орлов в результате множества подбрасываний справедливой монеты. Это открытие намного опередило свое время и было почти забыто до тех пор, пока знаменитый французский математик Пьер-Симон Лаплас спас его от безвестности в своей монументальной работе Аналитическая теория вероятностей, который был опубликован в 1812 году. Лаплас расширил открытие Де Муавра, аппроксимировав биномиальное распределение нормальным распределением. Но, как и в случае с Де Муавром, открытие Лапласа не привлекло особого внимания в его время. Важность центральной предельной теоремы осознали только в конце XIX века, когда в 1901 году русский математик Александр Ляпунов определил его в общих чертах и ​​точно доказал, как он работает математически. В настоящее время центральная предельная теорема считается неофициальным сувереном теории вероятностей.

сэр Фрэнсис Гальтон описал Центральную предельную теорему следующим образом:[42]

Я не знаю ничего более впечатляющего в воображении, чем чудесная форма космического порядка, выраженная «Законом частоты ошибок». Закон был бы олицетворен греками и обожествлен, если бы они знали о нем. Он царит безмятежно и в полном самоуничижении среди самого дикого смятения. Чем больше толпа и чем больше очевидная анархия, тем совершеннее ее власть. Это высший закон безрассудства. Всякий раз, когда берется большая выборка хаотических элементов и выстраивается в порядке их величины, неожиданная и самая прекрасная форма регулярности оказывается скрытой все время.

Фактический термин «центральная предельная теорема» (на немецком языке: «zentraler Grenzwertsatz») впервые был использован Георгий Полиа в 1920 г. в названии статьи.[43][44] Полиа назвал эту теорему «центральной» из-за ее важности в теории вероятностей. По словам Ле Кама, французская школа вероятностей интерпретирует слово центральный в том смысле, что «описывает поведение центра распределения в противоположность его хвостам».[44] Реферат статьи О центральной предельной теореме исчисления вероятностей и проблеме моментов по Pólya[43] в 1920 году переводится следующим образом.

Возникновение гауссовой плотности вероятности 1 = еИкс2 в повторяющихся экспериментах ошибки измерений, которые приводят к сочетанию очень многих и очень малых элементарных ошибок, в процессах диффузии и т. д., могут быть объяснены, как хорошо известно, той же самой предельной теоремой, которая играет центральную роль. роль в исчислении вероятностей. Настоящего первооткрывателя этой предельной теоремы следует назвать Лапласом; вполне вероятно, что его строгое доказательство было впервые дано Чебыщевым, и его наиболее точную формулировку можно найти, насколько мне известно, в статье Ляпунов. ...

Подробное изложение истории теоремы, детальное описание основополагающей работы Лапласа, а также Коши s, Бессель 'песок Пуассон Вклады предоставлены Hald.[45] Два исторических отчета, один охватывает развитие от Лапласа до Коши, второй - вклад автора фон Мизес, Pólya, Lindeberg, Леви, и Крамер в 20-е годы Ханс Фишер.[46] Ле Кам описывает период около 1935 года.[44] Бернштейн[47] представляет собой историческую дискуссию, посвященную работе Пафнутый Чебышев и его ученики Андрей Марков и Александр Ляпунов это привело к первым доказательствам CLT в общих условиях.

В течение 1930-х годов были представлены все более общие доказательства Центральной предельной теоремы. Было обнаружено, что многие природные системы демонстрируют Гауссовы распределения - типичным примером является распределение роста людей. Когда в начале 1900-х годов стали применяться статистические методы, такие как дисперсионный анализ, стало все более обычным делом предполагать лежащие в основе распределения Гаусса.[48]

Любопытная сноска к истории Центральной предельной теоремы состоит в том, что доказательство результата, аналогичного CLT Линдеберга 1922 года, было предметом исследования. Алан Тьюринг стипендиальная диссертация 1934 г. Королевский колледж на Кембриджский университет. Только после отправки работы Тьюринг узнал, что она уже доказана. Следовательно, диссертация Тьюринга не была опубликована.[49]

Смотрите также

Примечания

  1. ^ Montgomery, Douglas C .; Рангер, Джордж К. (2014). Прикладная статистика и вероятность для инженеров (6-е изд.). Вайли. п. 241. ISBN  9781118539712.
  2. ^ Руо, Матье (2013). Вероятность, статистика и оценка (PDF). п. 10.
  3. ^ Биллингсли (1995, стр. 357)
  4. ^ Бауэр (2001, теорема 30.13, с.199)
  5. ^ Биллингсли (1995, стр.362)
  6. ^ Ван дер Ваарт, А. В. (1998). Асимптотическая статистика. Нью-Йорк: Издательство Кембриджского университета. ISBN  978-0-521-49603-2. LCCN  98015176.
  7. ^ Райан О’Доннелл (2014, теорема 5.38) http://www.contrib.andrew.cmu.edu/~ryanod/?p=866
  8. ^ Бенткус, В. (2005). "Граница типа Ляпунова в ". Теория вероятн. Приложение. 49 (2): 311–323. Дои:10.1137 / S0040585X97981123.
  9. ^ Войт, Йоханнес (2003). «Раздел 5.4.3». Статистическая механика финансовых рынков. Тексты и монографии по физике. Springer-Verlag. ISBN  3-540-00978-7.
  10. ^ Гнеденко, Б.В .; Колмогоров, А. Н. (1954). Предельные распределения для сумм независимых случайных величин. Кембридж: Аддисон-Уэсли.
  11. ^ а б Учайкин, Владимир В .; Золотарев, В. М. (1999). Шанс и стабильность: стабильные дистрибутивы и их приложения. ВСП. С. 61–62. ISBN  90-6764-301-7.
  12. ^ Биллингсли (1995, теорема 27.5)
  13. ^ Дарретт (2004, раздел 7.7 (c), теорема 7.8)
  14. ^ Дарретт (2004, раздел 7.7, теорема 7.4)
  15. ^ Биллингсли (1995, теорема 35.12)
  16. ^ «Введение в случайные процессы в физике». jhupbooks.press.jhu.edu. Получено 2016-08-11.
  17. ^ Штейн, К. (1972). «Граница ошибки нормального приближения к распределению суммы зависимых случайных величин». Труды Шестого симпозиума Беркли по математической статистике и теории вероятностей: 583–602. МИСТЕР  0402873. Zbl  0278.60026.
  18. ^ Chen, L.H.Y .; Goldstein, L .; Шао, К. М. (2011). Нормальное приближение по методу Штейна.. Springer. ISBN  978-3-642-15006-7.
  19. ^ Арстейн, С.; Болл, К.; Барт, Ф.; Наор, А. (2004), «Решение проблемы Шеннона о монотонности энтропии», Журнал Американского математического общества, 17 (4): 975–982, Дои:10.1090 / S0894-0347-04-00459-X
  20. ^ Розенталь, Джеффри Сет (2000). Первый взгляд на строгую теорию вероятностей. World Scientific. Теорема 5.3.4, с. 47. ISBN  981-02-4322-7.
  21. ^ Джонсон, Оливер Томас (2004). Теория информации и центральная предельная теорема. Imperial College Press. п. 88. ISBN  1-86094-473-6.
  22. ^ Бородин, А. Н .; Ибрагимов, И. А .; Судаков, В. Н. (1995). Предельные теоремы для функционалов от случайных блужданий.. Книжный магазин AMS. Теорема 1.1, с. 8. ISBN  0-8218-0438-3.
  23. ^ Петров, В. В. (1976). Суммы независимых случайных величин. Нью-Йорк-Гейдельберг: Springer-Verlag. гл. 7. ISBN  9783642658099.
  24. ^ Хью, Патрик Чисан (2017). «Асимптотическое распределение вознаграждений, накопленных чередующимися процессами обновления». Статистика и вероятностные письма. 129: 355–359. Дои:10.1016 / j.spl.2017.06.027.
  25. ^ Rempala, G .; Весоловски Дж. (2002). «Асимптотика произведений сумм и U-статистика" (PDF). Электронные коммуникации в вероятности. 7: 47–54. Дои:10.1214 / ecp.v7-1046.
  26. ^ Клартаг (2007, теорема 1.2)
  27. ^ Дарретт (2004, раздел 2.4, пример 4.5)
  28. ^ Клартаг (2008, теорема 1)
  29. ^ Клартаг (2007, теорема 1.1)
  30. ^ Зигмунд, Антони (2003) [1959]. Тригонометрический ряд. Издательство Кембриджского университета. т. II, разд. XVI.5, теорема 5-5. ISBN  0-521-89053-5.
  31. ^ Гапошкин (1966, теорема 2.1.13)
  32. ^ Барани и Ву (2007, теорема 1.1)
  33. ^ Барани и Ву (2007, теорема 1.2)
  34. ^ Мекес, Элизабет (2008). «Линейные функции на классических группах матриц». Труды Американского математического общества. 360 (10): 5355–5366. arXiv:математика / 0509441. Дои:10.1090 / S0002-9947-08-04444-9. S2CID  11981408.
  35. ^ Гапошкин (1966, раздел 1.5)
  36. ^ Kotani, M .; Сунада, Тошиказу (2003). Спектральная геометрия кристаллических решеток. 338. Современная математика. С. 271–305. ISBN  978-0-8218-4269-0.
  37. ^ Сунада, Тошиказу (2012). Топологическая кристаллография - с точки зрения дискретного геометрического анализа. Обзоры и учебные пособия по прикладным математическим наукам. 6. Springer. ISBN  978-4-431-54177-6.
  38. ^ Динов, Христу и Санчес (2008)
  39. ^ "SOCR EduMaterials Activities GCLT Applications - Socr". Wiki.stat.ucla.edu. 2010-05-24. Получено 2017-01-23.
  40. ^ Marasinghe, M .; Микер, В .; Повар, Д .; Шин, Т. С. (август 1994 г.). «Использование графики и моделирования для обучения статистическим концепциям». Документ, представленный на Ежегодном собрании Американской ассоциации статистиков, Торонто, Канада. Цитировать журнал требует | журнал = (помощь)
  41. ^ Хенк, Таймс (2004). Понимание вероятности: правила случайности в повседневной жизни. Кембридж: Издательство Кембриджского университета. п. 169. ISBN  0-521-54036-4.
  42. ^ Гальтон, Ф. (1889). Естественное наследование. п. 66.
  43. ^ а б Полиа, Джордж (1920). "Über den zentralen Grenzwertsatz der Wahrscheinlichkeitsrechnung und das Momentenproblem" [О центральной предельной теореме вычисления вероятностей и проблеме моментов]. Mathematische Zeitschrift (на немецком). 8 (3–4): 171–181. Дои:10.1007 / BF01206525. S2CID  123063388.
  44. ^ а б c Ле Кам, Люсьен (1986). «Центральная предельная теорема около 1935 года». Статистическая наука. 1 (1): 78–91. Дои:10.1214 / сс / 1177013818.
  45. ^ Халд, Андреас (22 апреля 1998 г.). История математической статистики с 1750 по 1930 гг. (PDF). Gbv.de. Глава 17. ISBN  978-0471179122.
  46. ^ Фишер, Ганс (2011). История центральной предельной теоремы: от классической к современной теории вероятностей. Источники и исследования по истории математики и физических наук. Нью-Йорк: Спрингер. Дои:10.1007/978-0-387-87857-7. ISBN  978-0-387-87856-0. МИСТЕР  2743162. Zbl  1226.60004. (Глава 2: Центральная предельная теорема от Лапласа до Коши: изменения стохастических целей и аналитических методов, Глава 5.2: Центральная предельная теорема в двадцатые годы)
  47. ^ Бернштейн, С. (1945). «О работах П.Л. Чебышева по теории вероятностей». В Бернштейне., С. Н. (ред.). Научное наследие П. Л. Чебышева. Выпуск Первый: Математика [Научное наследие П. Л. Чебышева. Часть I. Математика] (на русском). Москва и Ленинград: Академия Наук СССР. п. 174.
  48. ^ Вольфрам, Стивен (2002). Новый вид науки. Wolfram Media, Inc. стр.977. ISBN  1-57955-008-8.
  49. ^ Забелл, С. Л. (1995). «Алан Тьюринг и центральная предельная теорема». Американский математический ежемесячный журнал. 102 (6): 483–494. Дои:10.1080/00029890.1995.12004608.
  50. ^ Йоргенсен, Бент (1997). Теория моделей дисперсии. Чепмен и Холл. ISBN  978-0412997112.

Рекомендации

внешняя ссылка