Функция роста - Growth function

В функция роста, также называемый коэффициент разрушения или сокрушительное число, измеряет богатство установить семью. Он особенно используется в контексте теория статистического обучения, где он измеряет сложность класса гипотез. Термин «функция роста» был введен Вапником и Червоненкисом в их статье 1968 года, где они также доказали многие из его свойств.[1]Это основная концепция в машинное обучение.[2][3]

Определения

Определение семейства наборов

Позволять быть установить семью (набор наборов) и множество. Их пересечение определяется как следующее семейство наборов:

В размер пересечения (также называемый показатель) из относительно является . Если набор имеет элементов, то индекс не более . Если индекс ровно 2м тогда набор как говорят, разбит , потому что содержит все подмножества , то есть:

Функция роста измеряет размер как функция . Формально:

Определение класса гипотез

Эквивалентно пусть быть классом гипотез (набор бинарных функций) и набор с элементы. В ограничение из к набор двоичных функций на что может быть получено из :[3]:45

Функция роста измеряет размер как функция :[3]:49

Примеры

1. Домен - это настоящая линия . Набор-семья содержит все полупрямы (лучей) от заданного числа до положительной бесконечности, т. е. все множества вида для некоторых . Для любого набора из реальные числа, пересечение содержит наборы: пустой набор, набор, содержащий самый большой элемент , множество, содержащее два наибольших элемента , и так далее. Следовательно: .[1]:Пример 1 То же самое верно ли содержит открытые полупрямы, замкнутые полупрямы или и то, и другое.

2. Домен - это сегмент . Набор-семья содержит все открытые множества. Для любого конечного множества из реальные числа, пересечение содержит все возможные подмножества . Есть такие подмножества, поэтому .[1]:Пример 2

3. Область - евклидово пространство. . Набор-семья содержит все полупространства формы: , где - фиксированный вектор. , где Comp - количество количество компонентов в разбиении n-мерного пространства m гиперплоскостями.[1]:Пример 3

4. Домен - это настоящая линия . Набор-семья содержит все действительные интервалы, т. е. все множества вида для некоторых . Для любого набора из реальные числа, пересечение содержит все серии от 0 до последовательные элементы . Количество таких запусков , так .

Полиномиальный или экспоненциальный

Основное свойство, делающее функцию роста интересной, заключается в том, что она может быть полиномиальной или экспоненциальной - ничего промежуточного.

Следующее - свойство размера пересечения:[1]:Лем.1

  • Если для некоторого набора размера , а для некоторого числа , -
  • тогда существует подмножество размера такой, что .

Отсюда следует следующее свойство функции роста.[1]:Th.1Для каждой семьи есть два случая:

  • В экспоненциальный случай: идентично.
  • В полиномиальный случай: мажорируется , где это наименьшее целое число, для которого .

Другие свойства

Тривиальная верхняя оценка

Для любого конечного :

поскольку для каждого , количество элементов в самое большее . Поэтому функция роста представляет наибольший интерес, когда бесконечно.

Экспоненциальная верхняя граница

Для любого непустого :

То есть функция роста имеет экспоненциальную оценку сверху.

Мы говорим, что набор-семья разбивается множество если их пересечение содержит все возможные подмножества , т.е. .Если разбивается размера , тогда , что является верхней границей.

Декартово пересечение

Определите декартово пересечение двух семейств множеств как:

.

Потом:[2]:57

Союз

На каждые два набора-семейств:[2]:58

Размер ВК

В Размер ВК из определяется в соответствии с этими двумя случаями:

  • в полиномиальный случай, = наибольшее целое число для которого .
  • в экспоненциальный случай .

Так если и только если .

Функцию роста можно рассматривать как уточнение концепции размерности ВК. Измерение VC только говорит нам, равно или меньше чем , а функция роста говорит нам, как именно изменяется в зависимости от .

Другая связь между функцией роста и размерностью ВК задается соотношением Лемма Зауэра – Шелаха.:[3]:49

Если , тогда:
для всех :

Особенно,

для всех :
поэтому, когда размерность VC конечна, функция роста полиномиально растет с .

Эта верхняя граница точна, т. Е. Для всех Существует с размером ВК такой, что:[2]:56

Энтропия

В то время как функция роста связана с максимум размер пересечения, энтропия относится к средний размер перекрестка:[1]:272–273

Размер пересечения имеет следующее свойство. Для каждой сет-семьи :

Отсюда:

Более того, последовательность сходится к константе когда .

Более того, случайная величина сосредоточено около .

Приложения в теории вероятностей

Позволять быть набором, на котором вероятностная мера определено. Позволять быть семейством подмножеств (= семейство событий).

Допустим, мы выбираем набор который содержит элементы , где каждый элемент выбирается случайным образом в соответствии с вероятностной мерой , независимо от других (то есть с заменами). Для каждого события , мы сравниваем следующие две величины:

  • Его относительная частота в , т.е. ;
  • Его вероятность .

Нас интересует разница, . Эта разница удовлетворяет следующей верхней границе:

что эквивалентно:[1]:Th.2

Словами: вероятность того, что при все события в , относительная частота близка к вероятности, ограничена снизу выражением, которое зависит от функции роста .

Следствием этого является то, что если и только если функция роста полиномиальна от (т.е. существует несколько такой, что ), то вероятность приближается к 1 при . То есть семья наслаждается равномерная сходимость по вероятности.

Рекомендации

  1. ^ а б c d е ж грамм час Вапник, В. Н .; Червоненкис, А.Я. (1971). «О равномерной сходимости относительных частот событий к их вероятностям». Теория вероятностей и ее приложения. 16 (2): 264. Дои:10.1137/1116025.Это английский перевод русской газеты Б. Секлера: «О равномерной сходимости относительных частот событий к их вероятностям». Докл. Акад. Наук. 181 (4): 781. 1968.Перевод был воспроизведен как:Вапник, В. Н .; Червоненкис, А.Я. (2015). «О равномерной сходимости относительных частот событий к их вероятностям». Меры сложности. п. 11. Дои:10.1007/978-3-319-21852-6_3. ISBN  978-3-319-21851-9.
  2. ^ а б c d Мохри, Мехриар; Ростамизаде, Афшин; Талвалкар, Амит (2012). Основы машинного обучения. США, Массачусетс: MIT Press. ISBN  9780262018258., особенно раздел 3.2
  3. ^ а б c d Шалев-Шварц, Шай; Бен-Давид, Шай (2014). Понимание машинного обучения - от теории к алгоритмам. Издательство Кембриджского университета. ISBN  9781107057135.