Ядро радиальной базисной функции - Radial basis function kernel

В машинное обучение, то радиальная базисная функция ядро, или Ядро RBF, популярный функция ядра используется в различных ядровый алгоритмы обучения. В частности, он обычно используется в Машина опорных векторов классификация.[1]

Ядро RBF на двух образцах Икс и Икс', представленные как векторы признаков в некоторых входное пространство, определяется как[2]

может быть признан квадрат евклидова расстояния между двумя векторами признаков. - свободный параметр. Эквивалентное определение включает параметр :

Поскольку значение ядра RBF уменьшается с расстоянием и колеблется от нуля (в пределе) до единицы (когда Икс = Икс'), имеет готовую интерпретацию как мера сходства.[2]В пространство функций ядра имеет бесконечное количество размерностей; для , его расширение:[3]

Приближения

Поскольку поддержка векторных машин и других моделей, использующих трюк с ядром плохо масштабируются для большого количества обучающих выборок или большого количества функций во входном пространстве, было введено несколько приближений к ядру RBF (и аналогичным ядрам).[4]Обычно они имеют форму функции z который отображает один вектор в вектор более высокой размерности, аппроксимируя ядро:

где - это неявное отображение, встроенное в ядро ​​RBF.

Один из способов построить такой z это случайная выборка из Преобразование Фурье ядра.[5] Другой подход использует Метод Нистрома приблизить собственное разложение из Матрица Грама K, используя только случайную выборку обучающего набора.[6]

Смотрите также

использованная литература

  1. ^ Чанг, Инь-Вэнь; Се, Чо-Джуй; Чанг, Кай-Вэй; Ринггаард, Майкл; Линь, Чи-Джен (2010). «Обучение и тестирование полиномиальных отображений данных низкой степени с помощью линейной SVM». Журнал исследований в области машинного обучения. 11: 1471–1490.
  2. ^ а б Жан-Филипп Верт, Коджи Цуда и Бернхард Шёлкопф (2004). «Учебник по ядерным методам». Ядерные методы в вычислительной биологии.
  3. ^ Шашуа, Амнон (2009). «Введение в машинное обучение: заметки 67577». arXiv:0904.3664v1 [cs.LG ].
  4. ^ Андреас Мюллер (2012). Аппроксимация ядра для эффективных SVM (и другие методы извлечения признаков).
  5. ^ Али Рахими и Бенджамин Рехт (2007). «Случайные функции для крупномасштабных ядерных машин». Системы обработки нейронной информации.
  6. ^ C.K.I. Уильямс и М. Сигер (2001). «Использование метода Нистрома для ускорения ядерных машин». Достижения в системах обработки нейронной информации.CS1 maint: использует параметр авторов (ссылка на сайт)