Полуопределенное вложение - Semidefinite embedding

Максимальное разворачивание дисперсии (MVU), также известный как Полуопределенное вложение (SDE), является алгоритм в Информатика который использует полуопределенное программирование выполнять уменьшение нелинейной размерности больших размеров векторный входные данные.[1][2][3]

Это мотивировано тем наблюдением, что Анализ основных компонентов ядра (kPCA) не снижает размерность данных,[4] поскольку он использует Уловка ядра для нелинейного отображения исходных данных в внутреннее пространство продукта.

Алгоритм

MVU создает отображение из входных векторов большой размерности в некоторое евклидово векторное пространство низкой размерности в следующих шагах:[5]

  1. А район график создан. Каждый вход связан со своими k-ближайшими входными векторами (согласно метрике евклидова расстояния), а все k-ближайшие соседи связаны друг с другом. Если данные отобраны достаточно хорошо, результирующий график является дискретной аппроксимацией лежащего в основе многообразия.
  2. Граф окрестностей «разворачивается» с помощью полуопределенного программирования. Вместо того, чтобы изучать выходные векторы напрямую, полуопределенное программирование направлено на поиск внутренней матрицы произведения, которая максимизирует попарные расстояния между любыми двумя входами, которые не связаны в графе соседства, сохраняя при этом расстояния до ближайших соседей.
  3. В конечном итоге низкоразмерное вложение получается применением многомерное масштабирование на выученной матрице внутреннего продукта.

Шаги применения полуопределенного программирования с последующим шагом уменьшения линейной размерности для восстановления низкоразмерного вложения в евклидово пространство были впервые предложены Linial, Лондон и Рабинович.[6]

Формулировка оптимизации

Позволять быть исходным вводом и быть вложением. Если являются двумя соседями, то необходимо выполнить ограничение локальной изометрии:[7][8][9]

Позволять быть Матрицы Грама из и (то есть: ). Мы можем выразить указанное выше ограничение для каждой соседней точки с точки зрения :[10][11]

Кроме того, мы также хотим ограничить вложение центрировать в начале координат:[12][13][14]

Как описано выше, за исключением того, что расстояния между соседними точками сохраняются, алгоритм стремится максимизировать попарное расстояние каждой пары точек. Максимизируемая целевая функция:[15][16][17]

Интуитивно, максимизация функции, описанной выше, эквивалентна оттягиванию точек как можно дальше друг от друга и, следовательно, «развертыванию» многообразия. Ограничение локальной изометрии [18]

Позволять куда

предотвращает расхождение целевой функции (уход в бесконечность).

Поскольку на графике N точек, расстояние между любыми двумя точками . Затем мы можем оценить целевую функцию следующим образом:[19][20]

Целевая функция может быть переписана чисто в виде матрицы Грама:[21][22][23]

Наконец, оптимизацию можно сформулировать как:[24][25][26]

После матрицы Грама изучается полуопределенным программированием, вывод можно получить через Разложение Холецкого.

В частности, матрица Грама может быть записана как куда это i-й элемент собственного вектора собственного значения .[27][28]

Отсюда следует, что -й элемент вывода является .[29][30]

Смотрите также

Примечания

  1. ^ Вайнбергер, Ша и Саул 2004a
  2. ^ Вайнбергер и Сол 2004b
  3. ^ Вайнбергер и Сол, 2006 г.
  4. ^ Лоуренс 2012, стр. 1612
  5. ^ Вайнбергер, Ша и Саул 2004a, стр.7.
  6. ^ Линиал, Лондон и Рабинович 1995
  7. ^ Вайнбергер, Ша и Саул 2004a, стр. 3, уравнение 8
  8. ^ Вайнбергер и Сол 2004b, стр. 3, уравнение 2
  9. ^ Вайнбергер и Сол, 2006 г., стр. 4, уравнение 2
  10. ^ Вайнбергер, Ша и Саул 2004a, стр. 3, уравнение 9
  11. ^ Вайнбергер и Сол 2004b, стр. 3, уравнение 3
  12. ^ Вайнбергер, Ша и Саул 2004a, стр. 3, уравнение 6
  13. ^ Вайнбергер и Сол 2004b, стр. 3, уравнение 5
  14. ^ Вайнбергер и Сол, 2006 г., страница 5, уравнение 8
  15. ^ Вайнбергер, Ша и Саул 2004a, страница 4, уравнение 10
  16. ^ Вайнбергер и Сол 2004b, стр. 4, уравнение 6
  17. ^ Вайнбергер и Сол, 2006 г., страница 5, уравнение 4
  18. ^ Вайнбергер и Сол 2004b, стр. 4, уравнение 7
  19. ^ Вайнбергер и Сол 2004b, стр. 4, уравнение 8
  20. ^ Вайнбергер и Сол, 2006 г., стр. 5, уравнение 6
  21. ^ Вайнбергер, Ша и Саул 2004a, стр. 4, уравнение 11
  22. ^ Вайнбергер и Сол 2004b, стр. 4, уравнение 9
  23. ^ Вайнбергер и Сол, 2006 г., стр. 6, уравнения с 10 по 13
  24. ^ Вайнбергер, Ша и Саул 2004a, стр. 4, раздел 3.3
  25. ^ Вайнбергер и Сол 2004b, стр. 4, уравнение 9
  26. ^ Вайнбергер и Сол, 2006 г., стр. 6, уравнения с 10 по 13
  27. ^ Вайнбергер и Сол 2004b, страница 4, уравнение 10
  28. ^ Вайнбергер и Сол, 2006 г., страница 7, уравнения 14
  29. ^ Вайнбергер и Сол 2004b, стр. 4, уравнение 11
  30. ^ Вайнбергер и Сол, 2006 г., стр.7, уравнения 15

Рекомендации

Дополнительный материал