Изучение подобия - Википедия - Similarity learning

Изучение подобия это зона под присмотром машинное обучение в искусственный интеллект. Это тесно связано с регресс и классификация, но цель состоит в том, чтобы изучить функцию подобия, которая измеряет, насколько похожи или связаны два объекта. Он имеет приложения в рейтинг, в системы рекомендаций, визуальное отслеживание личности, проверка лица и проверка говорящего.

Настройка обучения

Существует четыре распространенных варианта дистанционного обучения по метрике и подобию.

Регресс изучение подобия
В этой настройке даны пары объектов вместе с мерой их сходства . Цель состоит в том, чтобы узнать функцию, которая приближает для каждого нового помеченного примера триплета . Обычно это достигается за счет минимизации упорядоченных потерь. .
Классификация изучение подобия
Даны пары одинаковых объектов и не похожие объекты . Эквивалентная формулировка состоит в том, что каждая пара дается вместе с двоичной меткой это определяет, похожи ли два объекта или нет. Цель снова состоит в том, чтобы изучить классификатор, который может решить, похожа новая пара объектов или нет.
Ранжирование изучения сходства
Даны тройки объектов относительное сходство которых подчиняется заранее определенному порядку: как известно, больше похож на чем . Цель - изучить функцию так что для любой новой тройки объектов , это подчиняется (контрастивное обучение ). Эта установка предполагает более слабую форму наблюдения, чем при регрессии, потому что вместо обеспечения точного мера сходства, нужно только обеспечить относительный порядок подобия. По этой причине изучение подобия на основе ранжирования легче применять в реальных крупномасштабных приложениях.[1].
Хеширование с учетом местоположения (LSH)[2]
Хеши элементы ввода, чтобы похожие элементы с высокой вероятностью отображались в одни и те же «сегменты» в памяти (количество сегментов намного меньше, чем набор возможных элементов ввода). Он часто применяется в поиске ближайшего соседа по крупномасштабным данным большой размерности, например, базам данных изображений, коллекциям документов, базам данных временных рядов и базам данных генома.[3]

Распространенный подход к изучению подобия - моделирование функции подобия как билинейная форма. Например, в случае ранжирования обучения по подобию, нужно изучить матрицу W, которая параметризует функцию подобия . Когда данных много, общий подход - изучить сиамская сеть - Глубокая сетевая модель с разделением параметров.

Метрическое обучение

Изучение подобия тесно связано с дистанционное метрическое обучение. Метрическое обучение - это задача обучения дистанционной функции над объектами. А метрика или же функция расстояния должен подчиняться четырем аксиомам: неотрицательность, идентичность неразличимых, симметрия и субаддитивность (или неравенство треугольника). На практике алгоритмы обучения метрикам игнорируют условие идентичности неразличимых и изучают псевдометрику.

Когда объекты векторы в , то любая матрица в симметричном положительном полуопределенном конусе определяет псевдометрику расстояния пространства x через форму . Когда - симметричная положительно определенная матрица, это метрика. Более того, как любая симметричная положительно полуопределенная матрица можно разложить как куда и , функция расстояния можно переписать эквивалентно . Расстояние соответствует евклидовому расстоянию между преобразованными векторы признаков и .

Было предложено множество формулировок для метрического обучения. [4][5]. Некоторые хорошо известные подходы к метрическому обучению включают обучение на основе относительных сравнений.[6] который основан на Потеря триплета, Большой запас ближайшего соседа[7], Теоретико-метрическое обучение информации (ITML).[8]

В статистика, то ковариация матрица данных иногда используется для определения метрики расстояния, называемой Расстояние Махаланобиса.

Приложения

Обучение подобию используется в поиске информации для учиться ранжировать, при проверке лица или идентификации лица,[9][10] И в системы рекомендаций. Кроме того, многие подходы к машинному обучению полагаются на некоторую метрику. Это включает в себя обучение без учителя, такое как кластеризация, который группирует вместе близкие или похожие объекты. Он также включает контролируемые подходы, такие как Алгоритм K-ближайшего соседа которые полагаются на метки близлежащих объектов, чтобы выбрать метку нового объекта. Метрическое обучение было предложено в качестве этапа предварительной обработки для многих из этих подходов.[11]

Масштабируемость

Метрика и изучение подобия наивно масштабируются квадратично с размерностью входного пространства, что легко увидеть, когда изученная метрика имеет билинейную форму . Масштабирование до более высоких измерений может быть достигнуто путем наложения структуры разреженности на матричную модель, как это сделано с HDSL,[12] и с COMET.[13]

Смотрите также

дальнейшее чтение

Для получения дополнительной информации по этой теме см. Обзоры по метрике и изучению сходства, проведенные Bellet et al.[4] и Кулис[5].

Рекомендации

  1. ^ Чечик, Г .; Sharma, V .; Шалит, У .; Бенджио, С. (2010). «Крупномасштабное онлайн-изучение сходства изображений посредством ранжирования» (PDF). Журнал исследований в области машинного обучения. 11: 1109–1135.
  2. ^ Гионис, Аристидес, Петр Индик и Раджив Мотвани. «Поиск сходства в больших измерениях с помощью хеширования». VLDB. Vol. 99. № 6. 1999.
  3. ^ Rajaraman, A .; Ульман, Дж. (2010). «Разработка массивных наборов данных, глава 3».
  4. ^ а б Bellet, A .; Habrard, A .; Себбан, М. (2013). «Обзор изучения показателей для векторов признаков и структурированных данных». arXiv:1306.6709 [cs.LG ].
  5. ^ а б Кулис, Б. (2012). «Метрическое обучение: обзор». Основы и тенденции в машинном обучении. 5 (4): 287–364. Дои:10.1561/2200000019.
  6. ^ Шульц, М .; Иоахим, Т. (2004). «Изучение метрики расстояния на основе относительных сравнений» (PDF). Достижения в системах обработки нейронной информации. 16: 41–48.
  7. ^ Weinberger, K. Q .; Blitzer, J.C .; Саул, Л. К. (2006). «Дистанционное метрическое обучение для классификации ближайшего соседа с большой маржой» (PDF). Достижения в системах обработки нейронной информации. 18: 1473–1480.
  8. ^ Davis, J. V .; Кулис, Б .; Jain, P .; Sra, S .; Диллон, И. С. (2007). "Теоретико-информационное метрическое обучение". Международная конференция по машинному обучению (ICML): 209–216.
  9. ^ Guillaumin, M .; Verbeek, J .; Шмид, К. (2009). «Это вы? Метрические подходы к распознаванию лиц» (PDF). Международная конференция IEEE по компьютерному зрению (ICCV).
  10. ^ Mignon, A .; Юри, Ф. (2012). «PCCA: новый подход к дистанционному обучению с редкими попарными ограничениями» (PDF). Конференция IEEE по компьютерному зрению и распознаванию образов.
  11. ^ Xing, E.P .; Ng, A. Y .; Jordan, M. I .; Рассел, С. (2002). «Дистанционное метрическое обучение с применением к кластеризации с дополнительной информацией» (PDF). Достижения в системах обработки нейронной информации. 15: 505–512.
  12. ^ Лю; Bellet; Ша (2015). «Изучение подобия для разреженных данных большой размерности» (PDF). Международная конференция по искусственному интеллекту и статистике (AISTATS). arXiv:1411.2374. Bibcode:2014arXiv1411.2374L.
  13. ^ Ацмон; Шалит; Чечик (2015). «Изучение разреженных показателей, по одной функции за раз» (PDF). J. Mach. Учиться. Исследования (JMLR).