Полуопределенное вложение - Semidefinite embedding
Максимальное разворачивание дисперсии (MVU), также известный как Полуопределенное вложение (SDE), является алгоритм в Информатика который использует полуопределенное программирование выполнять уменьшение нелинейной размерности больших размеров векторный входные данные.[1][2][3]
Это мотивировано тем наблюдением, что Анализ основных компонентов ядра (kPCA) не снижает размерность данных,[4] поскольку он использует Уловка ядра для нелинейного отображения исходных данных в внутреннее пространство продукта.
Алгоритм
MVU создает отображение из входных векторов большой размерности в некоторое евклидово векторное пространство низкой размерности в следующих шагах:[5]
- А район график создан. Каждый вход связан со своими k-ближайшими входными векторами (согласно метрике евклидова расстояния), а все k-ближайшие соседи связаны друг с другом. Если данные отобраны достаточно хорошо, результирующий график является дискретной аппроксимацией лежащего в основе многообразия.
- Граф окрестностей «разворачивается» с помощью полуопределенного программирования. Вместо того, чтобы изучать выходные векторы напрямую, полуопределенное программирование направлено на поиск внутренней матрицы произведения, которая максимизирует попарные расстояния между любыми двумя входами, которые не связаны в графе соседства, сохраняя при этом расстояния до ближайших соседей.
- В конечном итоге низкоразмерное вложение получается применением многомерное масштабирование на выученной матрице внутреннего продукта.
Шаги применения полуопределенного программирования с последующим шагом уменьшения линейной размерности для восстановления низкоразмерного вложения в евклидово пространство были впервые предложены Linial, Лондон и Рабинович.[6]
Формулировка оптимизации
Позволять быть исходным вводом и быть вложением. Если являются двумя соседями, то необходимо выполнить ограничение локальной изометрии:[7][8][9]
Позволять быть Матрицы Грама из и (то есть: ). Мы можем выразить указанное выше ограничение для каждой соседней точки с точки зрения :[10][11]
Кроме того, мы также хотим ограничить вложение центрировать в начале координат:[12][13][14]
Как описано выше, за исключением того, что расстояния между соседними точками сохраняются, алгоритм стремится максимизировать попарное расстояние каждой пары точек. Максимизируемая целевая функция:[15][16][17]
Интуитивно, максимизация функции, описанной выше, эквивалентна оттягиванию точек как можно дальше друг от друга и, следовательно, «развертыванию» многообразия. Ограничение локальной изометрии [18]
Позволять куда
предотвращает расхождение целевой функции (уход в бесконечность).
Поскольку на графике N точек, расстояние между любыми двумя точками . Затем мы можем оценить целевую функцию следующим образом:[19][20]
Целевая функция может быть переписана чисто в виде матрицы Грама:[21][22][23]
Наконец, оптимизацию можно сформулировать как:[24][25][26]
После матрицы Грама изучается полуопределенным программированием, вывод можно получить через Разложение Холецкого.
В частности, матрица Грама может быть записана как куда это i-й элемент собственного вектора собственного значения .[27][28]
Отсюда следует, что -й элемент вывода является .[29][30]
Смотрите также
- Локально линейное вложение
- Изометрия (математика)
- Выравнивание местного касательного пространства
- Риманово многообразие
- Минимизация энергии
Примечания
- ^ Вайнбергер, Ша и Саул 2004a
- ^ Вайнбергер и Сол 2004b
- ^ Вайнбергер и Сол, 2006 г.
- ^ Лоуренс 2012, стр. 1612
- ^ Вайнбергер, Ша и Саул 2004a, стр.7.
- ^ Линиал, Лондон и Рабинович 1995
- ^ Вайнбергер, Ша и Саул 2004a, стр. 3, уравнение 8
- ^ Вайнбергер и Сол 2004b, стр. 3, уравнение 2
- ^ Вайнбергер и Сол, 2006 г., стр. 4, уравнение 2
- ^ Вайнбергер, Ша и Саул 2004a, стр. 3, уравнение 9
- ^ Вайнбергер и Сол 2004b, стр. 3, уравнение 3
- ^ Вайнбергер, Ша и Саул 2004a, стр. 3, уравнение 6
- ^ Вайнбергер и Сол 2004b, стр. 3, уравнение 5
- ^ Вайнбергер и Сол, 2006 г., страница 5, уравнение 8
- ^ Вайнбергер, Ша и Саул 2004a, страница 4, уравнение 10
- ^ Вайнбергер и Сол 2004b, стр. 4, уравнение 6
- ^ Вайнбергер и Сол, 2006 г., страница 5, уравнение 4
- ^ Вайнбергер и Сол 2004b, стр. 4, уравнение 7
- ^ Вайнбергер и Сол 2004b, стр. 4, уравнение 8
- ^ Вайнбергер и Сол, 2006 г., стр. 5, уравнение 6
- ^ Вайнбергер, Ша и Саул 2004a, стр. 4, уравнение 11
- ^ Вайнбергер и Сол 2004b, стр. 4, уравнение 9
- ^ Вайнбергер и Сол, 2006 г., стр. 6, уравнения с 10 по 13
- ^ Вайнбергер, Ша и Саул 2004a, стр. 4, раздел 3.3
- ^ Вайнбергер и Сол 2004b, стр. 4, уравнение 9
- ^ Вайнбергер и Сол, 2006 г., стр. 6, уравнения с 10 по 13
- ^ Вайнбергер и Сол 2004b, страница 4, уравнение 10
- ^ Вайнбергер и Сол, 2006 г., страница 7, уравнения 14
- ^ Вайнбергер и Сол 2004b, стр. 4, уравнение 11
- ^ Вайнбергер и Сол, 2006 г., стр.7, уравнения 15
Рекомендации
- Линиал, Лондон и Рабинович, Натан, Эран и Юрий (1995). «Геометрия графов и некоторые ее алгоритмические приложения». Комбинаторика. 15 (2): 215–245. Дои:10.1007 / BF01200757. S2CID 5071936.
- Вайнбергер, Ша и Саул, Килиан К., Фей и Лоуренс К. (4 июля 2004 г.). Изучение матрицы ядра для нелинейного уменьшения размерности. Материалы двадцать первой международной конференции по машинному обучению (ICML 2004). Банф, Альберта, Канада.CS1 maint: ref = harv (связь)
- Вайнбергер и Сол, Килиан К. и Лоуренс К. (27 июня 2004b). Неконтролируемое обучение многообразий изображений с помощью полуопределенного программирования. Конференция компьютерного общества IEEE 2004 года по компьютерному зрению и распознаванию образов. 2.CS1 maint: ref = harv (связь)
- Вайнбергер и Сол, Килиан К. и Лоуренс К. (1 мая 2006 г.). «Неконтролируемое обучение многообразий изображений с помощью полуопределенного программирования» (PDF). Международный журнал компьютерного зрения. 70: 77–90. Дои:10.1007 / s11263-005-4939-z. S2CID 291166.CS1 maint: ref = harv (связь)
- Лоуренс, Нил Д. (2012). «Объединяющая вероятностная перспектива для уменьшения спектральной размерности: идеи и новые модели». Журнал исследований в области машинного обучения. 13 (Май): 1612 г. arXiv:1010.4830. Bibcode:2010arXiv1010.4830L.