Равномерная сходимость по вероятности - Uniform convergence in probability

Равномерная сходимость по вероятности это форма сходимость по вероятности в статистическая асимптотическая теория и теория вероятности. Это означает, что при определенных условиях эмпирические частоты всех событий в определенной семье событий сходятся к своим теоретические вероятности. Равномерная сходимость по вероятности имеет приложения к статистика а также машинное обучение как часть теория статистического обучения.

В закон больших чисел говорит, что для каждого Один событие, его эмпирическая частота в последовательности независимых испытаний сходится (с большой вероятностью) к его теоретической вероятности. Но в некоторых приложениях нас интересует не одно событие, а целое. семейство событий. Мы хотели бы знать, сходится ли эмпирическая частота каждого события в семье к его теоретической вероятности. одновременно.[нужна цитата ] Теорема о равномерной сходимости дает достаточное условие для этой сходимости. Грубо говоря, если семейство событий достаточно простое (его Размер ВК достаточно мало), то имеет место равномерная сходимость.

Определения

Для класса предикаты определен на множестве и набор образцов , куда , то эмпирическая частота из на является

В теоретическая вероятность из определяется как

Теорема о равномерной сходимости грубо утверждает, что если "просто" и мы сами (с заменой) берем образцы из по любому распределению , тогда с большой вероятностью, эмпирическая частота будет близка к своей ожидаемое значение, что является теоретической вероятностью.[нужна цитата ]

Здесь «простой» означает, что Размерность Вапника – Червоненкиса класса мала по сравнению с размером выборки. Другими словами, достаточно простой набор функций ведет себя примерно так же на небольшой случайной выборке, как и на распределении в целом.

Теорема о равномерной сходимости была впервые доказана Вапником и Червоненкисом.[1] используя концепцию функция роста.

Теорема о равномерной сходимости

Утверждение теоремы о равномерной сходимости выглядит следующим образом:[2]

Если это набор -значные функции, определенные на множестве и это распределение вероятностей на тогда для и положительное целое число, имеем:

где для любого ,
и . указывает, что вероятность взята за состоящий из i.i.d. извлекает из раздачи .
определяется как: Для любого -значные функции над и ,

И для любого натурального числа , то сокрушительное число определяется как:

С точки зрения теории обучения можно рассматривать быть Концепция / Гипотеза класс, определенный в наборе экземпляров . Прежде чем переходить к деталям доказательства теоремы, сформулируем лемму Зауэра, которая нам понадобится в нашем доказательстве.

Лемма Зауэра – Шелаха.

В Лемма Зауэра – Шелаха.[3] связывает сокрушительное число в VC Dimension.

Лемма: , куда это VC Dimension концептуального класса .

Следствие: .

Доказательство теоремы о равномерной сходимости

[1] и [2] являются источниками доказательства ниже. Прежде чем мы перейдем к деталям доказательства Теорема о равномерной сходимости мы представим общий обзор доказательства.

  1. Симметризация: Преобразуем проблему анализа в проблему анализа , куда и i.i.d образцы размера составлен согласно распределению . Можно просмотреть как исходный произвольно выбранный образец длины , пока можно рассматривать как образец для испытаний, который используется для оценки .
  2. Перестановка: С и выбираются одинаково и независимо, поэтому замена элементов между ними не изменит распределение вероятностей на и . Итак, попробуем ограничить вероятность для некоторых рассматривая эффект определенного набора перестановок объединенной выборки . В частности, мы рассматриваем перестановки которые обмениваются и в некотором подмножестве . Символ означает конкатенацию и .[нужна цитата ]
  3. Приведение к конечному классу: Теперь мы можем ограничить класс функций к фиксированному образцу соединения и, следовательно, если имеет конечную размерность VC, проблема сводится к задаче, связанной с конечным функциональным классом.

Приведем технические детали доказательства.

Симметризация

Лемма: Позволять и

Тогда для , .

Доказательство: по неравенству треугольника
если и тогда .

Следовательно,

поскольку и независимы.

Теперь для исправить такой, что . За это , мы покажем, что

Таким образом, для любого , и поэтому . И поэтому мы выполняем первый шаг нашей высокоуровневой идеи.

Уведомление, биномиальная случайная величина с математическим ожиданием и дисперсия . К Неравенство Чебышева мы получили

для упомянутой границы . Здесь мы используем тот факт, что за .

Перестановки

Позволять быть набором всех перестановок это меняет местами и в некотором подмножестве .

Лемма: Позволять быть любым подмножеством и любое распределение вероятностей на . Потом,

где ожидание закончилось выбран в соответствии с , и вероятность больше выбирается единообразно из .

Доказательство: Для любого

(поскольку перестановки координат сохраняют распределение продукта .)

Максимум гарантированно существует, поскольку существует только конечный набор значений, которые может принимать вероятность при случайной перестановке.

Приведение к конечному классу

Лемма: На основании предыдущей леммы

.

Доказательство. Определим и что самое большее . Это означает, что есть функции такой, что для любого между и с за

Мы видим, что если и только для некоторых в удовлетворяет,. Следовательно, если мы определим если и иначе.

За и у нас есть это если и только для некоторых в удовлетворяет . По объединению мы получаем

Поскольку распределение по перестановкам единообразно для каждого , так равно , с равной вероятностью.

Таким образом,

где вероятность справа больше и обе возможности одинаково вероятны. К Неравенство Хёффдинга, это самое большее .

Наконец, объединяя все три части доказательства, мы получаем Теорема о равномерной сходимости.

Рекомендации

  1. ^ а б Вапник, В. Н .; Червоненкис, А.Я. (1971). «О равномерной сходимости относительных частот событий к их вероятностям». Теория вероятностей и ее приложения. 16 (2): 264. Дои:10.1137/1116025.Это английский перевод русской газеты Б. Секлера: «О равномерной сходимости относительных частот событий к их вероятностям». Докл. Акад. Наук. 181 (4): 781. 1968.Перевод был воспроизведен как:Вапник, В. Н .; Червоненкис, А.Я. (2015). «О равномерной сходимости относительных частот событий к их вероятностям». Меры сложности. п. 11. Дои:10.1007/978-3-319-21852-6_3. ISBN  978-3-319-21851-9.
  2. ^ а б Мартин Энтони Питер, л. Бартлетт. Обучение нейронной сети: теоретические основы, страницы 46–50. Первое издание, 1999. Cambridge University Press ISBN  0-521-57353-X
  3. ^ Шам Какаде и Амбудж Тевари, CMSC 35900 (весна 2008 г.) Теория обучения, лекция 11