Обучение предпочтениям - Preference learning

Обучение предпочтениям это подполе в машинное обучение, который представляет собой метод классификации, основанный на наблюдаемой информации о предпочтениях. ^[1]. По мнению контролируемое обучение, обучение предпочтениям обучает набору элементов, которые имеют предпочтения по отношению к ярлыкам или другим элементам, и предсказывает предпочтения для всех элементов.

Хотя концепция обучения предпочтениям возникла в течение некоторого времени во многих областях, таких как экономика,^[2] это относительно новая тема в Искусственный интеллект исследование. За последнее десятилетие на нескольких семинарах обсуждались вопросы обучения предпочтениям и связанные с ним темы.^[3]

Задачи

Основная задача в обучении предпочтениям касается проблем в "учиться ранжировать ". В соответствии с различными типами наблюдаемой информации о предпочтениях, задачи в книге разделены на три основные проблемы. Предпочтительное обучение:^[4]

Рейтинг лейбла

При ранжировании меток модель имеет пространство экземпляров ${ Displaystyle X = {x_ {i} } , !}$ и конечный набор меток ${ Displaystyle Y = {Y_ {i} | я = 1,2, cdots, k } , !}$ . Информация о предпочтениях представлена в форме ${ displaystyle y_ {i} succ _ {x} y_ {j} , !}$ указывающий экземпляр ${ Displaystyle х , !}$ проявляет предпочтение в ${ Displaystyle у_ {я} , !}$ скорее, чем ${ displaystyle y_ {j} , !}$ . Набор информации о предпочтениях используется в модели в качестве обучающих данных. Задача этой модели - найти ранжирование предпочтений среди ярлыков для любого экземпляра.

Наблюдались некоторые условные классификация Задачи можно обобщить в рамках задачи ранжирования этикеток:^[5] если обучающий экземпляр ${ Displaystyle х , !}$ помечен как класс ${ Displaystyle у_ {я} , !}$ , это означает, что ${ displaystyle forall j neq i, y_ {i} succ _ {x} y_ {j} , !}$ . в мульти-лейбл дело, ${ Displaystyle х , !}$ связан с набором меток ${ Displaystyle L substeq Y , !}$ и, таким образом, модель может извлекать набор информации о предпочтениях ${ displaystyle {y_ {i} succ _ {x} y_ {j} | y_ {i} in L, y_ {j} in Y backslash L } , !}$ . Обучение модели предпочтений на этой информации о предпочтениях, и результат классификации экземпляра - это просто соответствующая метка верхнего ранга.

Рейтинг экземпляров

В рейтинге экземпляров также есть пространство экземпляров ${ Displaystyle X , !}$ и набор этикеток ${ Displaystyle Y , !}$ . В этой задаче для меток определен фиксированный порядок. ${ displaystyle y_ {1} succ y_ {2} succ cdots succ y_ {k} , !}$ и каждый экземпляр ${ Displaystyle х_ {l} , !}$ связан с ярлыком ${ displaystyle y_ {l} , !}$ . Предоставляя набор экземпляров в качестве обучающих данных, цель этой задачи - найти порядок ранжирования для нового набора экземпляров.

Рейтинг объекта

Ранжирование объектов аналогично ранжированию экземпляров, за исключением того, что с экземплярами не связаны метки. Учитывая набор информации о парных предпочтениях в форме ${ displaystyle x_ {i} succ x_ {j} , !}$ и модель должна определить порядок ранжирования среди экземпляров.

Методы

Есть два практических представления информации о предпочтениях. ${ Displaystyle A succ B , !}$ . Один назначает ${ Displaystyle А , !}$ и ${ Displaystyle B , !}$ с двумя действительными числами ${ Displaystyle а , !}$ и ${ Displaystyle б , !}$ соответственно такие, что ${ Displaystyle а> б , !}$ . Другой присваивает двоичное значение ${ Displaystyle В (А, В) в {0,1 } , !}$ для всех пар ${ Displaystyle (А, В) , !}$ обозначая, есть ли ${ Displaystyle A succ B , !}$ или же ${ Displaystyle B succ A , !}$ . В соответствии с этими двумя разными представлениями к процессу обучения применяются два разных метода.

Вспомогательная функция

Если мы сможем найти соответствие данных действительным числам, ранжирование данных может быть решено путем ранжирования реальных чисел. Это отображение называется вспомогательная функция. Для ранжирования этикеток отображение - это функция ${ displaystyle f: X times Y rightarrow mathbb {R} , !}$ такой, что ${ displaystyle y_ {i} succ _ {x} y_ {j} Rightarrow f (x, y_ {i})> f (x, y_ {j}) , !}$ . Например, ранжирование и ранжирование объектов отображение - это функция ${ displaystyle f: X rightarrow mathbb {R} , !}$ .

Нахождение функции полезности - это регресс проблема обучения, которая хорошо развита в машинном обучении.

Отношения предпочтений

Двоичное представление информации о предпочтениях называется отношением предпочтений. Для каждой пары альтернатив (экземпляров или меток) бинарный предикат может быть изучен с помощью обычного подхода к обучению с надзором. Фюрнкранц и Хюллермайер предложили этот подход к проблеме ранжирования этикеток.^[6] Для ранжирования объектов существует ранний подход Cohen et al.^[7]

Использование отношений предпочтений для прогнозирования рейтинга будет не таким интуитивным. Поскольку отношение предпочтения не является транзитивным, это означает, что решение ранжирования, удовлетворяющее этим отношениям, иногда было бы недостижимо или могло бы быть более одного решения. Более распространенный подход - найти решение ранжирования, которое максимально соответствует отношениям предпочтений. Этот подход является естественным продолжением попарной классификации.^[6]

Использует

Обучение предпочтениям можно использовать для ранжирования результатов поиска в соответствии с отзывами о предпочтениях пользователя. Учитывая запрос и набор документов, модель обучения используется для определения ранжирования документов, соответствующего релевантности этому запросу. Дополнительные обсуждения исследований в этой области можно найти в обзорной статье Ти-Янь Лю.^[8]

Еще одно приложение обучения предпочтениям: рекомендательные системы.^[9] Интернет-магазин может проанализировать историю покупок клиента, чтобы узнать модель предпочтений, а затем рекомендовать аналогичные продукты клиентам. Поставщики интернет-контента могут использовать рейтинги пользователей, чтобы предоставлять более предпочтительный контент.

Смотрите также

Учимся ранжировать

внешняя ссылка

Сайт обучения предпочтениям

[1] Мохри, Мехриар; Ростамизаде, Афшин; Талвалкар, Амит (2012). Основы машинного обучения. США, Массачусетс: MIT Press. ISBN 9780262018258.

[SHOG00-2] Шогрен, Джейсон Ф .; Список, Джон А .; Хейс, Дермот Дж. (2000). "Предпочтительное обучение на последовательных экспериментальных аукционах". Американский журнал экономики сельского хозяйства. 82 (4): 1016–1021. Дои:10.1111/0002-9092.00099.

[WEB:WORKSHOP-3] «Мастер-классы по обучению предпочтениям».

[FURN11-4] Фюрнкранц, Йоханнес; Хюллермайер, Эйке (2011). «Обучение предпочтениям: введение». Предпочтительное обучение. Springer-Verlag New York, Inc., стр. 3–8. ISBN 978-3-642-14124-9.

[HARP03-5] Хар-пелед, Сариэль; Рот, Дан; Зимак, Дав (2003). «Классификация ограничений для мультиклассовой классификации и ранжирования». В материалах 16-й ежегодной конференции по системам обработки нейронной информации, НИПС-02: 785–792.

[FURN03-6] а ^б Фюрнкранц, Йоханнес; Хюллермайер, Эйке (2003). «Парное обучение и ранжирование предпочтений». Материалы 14-й Европейской конференции по машинному обучению: 145–156.

[COHE98-7] Коэн, Уильям У .; Schapire, Robert E .; Певец, Йорам (1998). «Учимся порядку». В материалах конференции 1997 г. по достижениям в системах обработки нейронной информации: 451–457.

[LIU09-8] Лю, Тие-Ян (2009). «Обучение ранжированию для поиска информации». Основы и тенденции поиска информации. 3 (3): 225–331. Дои:10.1561/1500000016.

[GEMM09-9] Геммис, Марко Де; Яквинта, Лев; Лопс, Паскуале; Мусто, Катальдо; Нардуччи, Феделусио; Семераро, Джованни (2009). «Обучение предпочтениям в рекомендательных системах» (PDF). Предпочтительное обучение. 41: 387–407. Дои:10.1007/978-3-642-14125-6_18. ISBN 978-3-642-14124-9.

[1]

[2]

[3]

[4]

[5]

[6]

[7]

[8]

[9]