Активное обучение (машинное обучение) - Active learning (machine learning)

Активное изучение это частный случай машинное обучение в котором алгоритм обучения может интерактивно запрашивать пользователя (или какой-либо другой источник информации), чтобы пометить новые точки данных желаемыми выходными данными.[1][2][3] В статистической литературе это иногда также называют оптимальный экспериментальный план.[4] Источник информации также называют учитель или же оракул.

Бывают ситуации, когда немаркированных данных много, а ручная маркировка обходится дорого. В таком сценарии алгоритмы обучения могут активно запрашивать у пользователя / учителя ярлыки. Этот тип итеративного обучения с учителем называется активным обучением. Поскольку учащийся выбирает примеры, количество примеров для изучения концепции часто может быть намного меньше, чем количество, требуемое при обычном обучении с учителем. При таком подходе есть риск, что алгоритм будет перегружен неинформативными примерами. Последние разработки посвящены многокомпонентному активному обучению,[5] гибридное активное обучение[6] и активное обучение в однопроходном (онлайн) контексте,[7] сочетание концепций из области машинного обучения (например, конфликт и незнание) с адаптивным, постепенное обучение политика в области онлайн-машинное обучение.

Определения

Позволять Т - общий набор всех рассматриваемых данных. Например, в задаче белковой инженерии Т будет включать все белки, которые, как известно, обладают определенной интересной активностью, и все дополнительные белки, которые можно захотеть проверить на эту активность.

Во время каждой итерации я, Т разбит на три подмножества

  1. : Точки данных, где метка известен.
  2. : Точки данных, где метка неизвестный.
  3. : Подмножество ТU, я то есть выбранный быть помеченным.

Большинство текущих исследований активного обучения включает в себя лучший метод выбора точек данных для ТC, я.

Сценарии

  • Синтез запроса членства: Здесь учащийся генерирует свой собственный экземпляр из основного естественного распределения. Например, если набор данных представляет собой изображения людей и животных, ученик может послать учителю вырезанное изображение ноги и спросить, принадлежит ли этот придаток животному или человеку. Это особенно полезно, если набор данных небольшой.[8]
  • Выборка на основе пула: В этом сценарии экземпляры извлекаются из всего пула данных и им присваивается информативный балл - показатель того, насколько хорошо учащийся «понимает» данные. Затем система выбирает наиболее информативные экземпляры и запрашивает у учителя ярлыки.
  • Выборочная выборка на основе потоков: Здесь каждая немаркированная точка данных проверяется по очереди, при этом машина оценивает информативность каждого элемента по параметрам запроса. Учащийся сам решает, присвоить ли ему ярлык или запросить учителя для каждой точки данных.

Стратегии запросов

Алгоритмы определения того, какие точки данных следует пометить, можно разделить на несколько категорий в зависимости от их назначения:[1]

  • Баланс разведки и эксплуатации: выбор примеров для маркировки рассматривается как дилемма между исследованием и использованием представления пространства данных. Эта стратегия управляет этим компромиссом, моделируя проблему активного обучения как контекстную проблему бандита. Например, Bouneffouf et al.[9] предложите последовательный алгоритм под названием Active Thompson Sampling (ATS), который в каждом раунде назначает распределение выборки в пуле, отбирает одну точку из этого распределения и запрашивает у оракула эту метку точки выборки.
  • Ожидаемое изменение модели: отметьте те точки, которые больше всего повлияют на текущую модель.
  • Ожидаемое уменьшение ошибок: обозначьте те точки, которые в наибольшей степени уменьшат ошибка обобщения.
  • Экспоненциальное исследование градиентов для активного обучения:[10] В этой статье автор предлагает последовательный алгоритм, названный экспоненциальным градиентом (EG) -активный, который может улучшить любой алгоритм активного обучения с помощью оптимального случайного исследования.
  • Выборка неопределенности: обозначить те точки, для которых текущая модель наименее уверена в том, каким должен быть правильный результат.
  • Запрос комитета: различные модели обучаются на текущих помеченных данных и голосуют за результат для немаркированных данных; обозначьте те пункты, по которым "комитет" не согласен больше всего
  • Запросы из различных подпространств или разделов:[11] Когда базовая модель представляет собой лес деревьев, листовые узлы могут представлять (перекрывающиеся) части исходного пространство функций. Это дает возможность выбора экземпляров из неперекрывающихся или минимально перекрывающихся разделов для маркировки.
  • Снижение дисперсии: пометьте те точки, которые минимизируют отклонение результатов, что является одним из компонентов ошибки.
  • Конформные предсказатели: Этот метод предсказывает, что новая точка данных будет иметь метку, подобную старым точкам данных определенным образом, и степень сходства в старых примерах используется для оценки достоверности прогноза.[12]
  • Несоответствие-первое-самое дальнее-прохождение: Основным критерием выбора является несоответствие прогнозов между текущей моделью и прогнозом ближайшего соседа. Он нацелен на ошибочно предсказанные точки данных. Второй критерий выбора - это расстояние до ранее выбранных данных, сначала самые дальние. Он направлен на оптимизацию разнообразия выбранных данных.[13]

Было изучено множество алгоритмов, которые попадают в эти категории.[1][4]

Минимальная маргинальная гиперплоскость

Некоторые алгоритмы активного обучения построены на машины опорных векторов (SVM) и используйте структуру SVM, чтобы определить, какие точки данных нужно пометить. Такие методы обычно рассчитывают поле, W, каждого немаркированного элемента данных в ТU, я и лечить W как п-мерное расстояние от этой точки отсчета до разделяющей гиперплоскости.

Методы минимальной маргинальной гиперплоскости предполагают, что данные с наименьшим W те, в отношении которых SVM больше всего сомневается, и поэтому их следует поместить в ТC, я быть помеченным. Другие аналогичные методы, такие как Гиперплоскость максимального предела, выбирают данные с наибольшим W. Методы компромисса выбирают сочетание наименьшего и наибольшего Wс.

Смотрите также

Примечания

  1. ^ а б c Сетлс, Берр (2010). «Обзор литературы для активного обучения» (PDF). Технический отчет по информатике 1648. Университет Висконсина-Мэдисона. Получено 2014-11-18. Цитировать журнал требует | журнал = (помощь)
  2. ^ Рубенс, Нил; Элахи, Мехди; Сугияма, Масаси; Каплан, Дайн (2016). «Активное обучение в рекомендательных системах». В Риччи, Франческо; Рокач, Лиор; Шапира, Браха (ред.). Справочник рекомендательных систем (2-е изд.). Springer США. Дои:10.1007/978-1-4899-7637-6. HDL:11311/1006123. ISBN  978-1-4899-7637-6. S2CID  11569603.
  3. ^ Дас, Шубхомой; Вонг, Вен-Кин; Диттерих, Томас; Ферн, Алан; Эммотт, Эндрю (2016). «Включение отзывов экспертов в процесс обнаружения активных аномалий». В Бонки, Франческо; Доминго-Феррер, Жозеп; Баеза-Йейтс, Рикардо; Чжоу, Чжи-Хуа; У, Синьдун (ред.). IEEE 16-я Международная конференция по интеллектуальному анализу данных. IEEE. С. 853–858. Дои:10.1109 / ICDM.2016.0102. ISBN  978-1-5090-5473-2. S2CID  15285595.
  4. ^ а б Олссон, Фредрик (апрель 2009 г.). «Обзор литературы по активному машинному обучению в контексте обработки естественного языка». Технический отчет SICS T2009: 06. Цитировать журнал требует | журнал = (помощь)
  5. ^ Ян, Бишань; Сунь, Цзянь-Тао; Ван, Тэнцзяо; Чен, Чжэн (2009). «Эффективное многокомпонентное активное обучение для классификации текста» (PDF). Материалы 15-й международной конференции ACM SIGKDD по открытию знаний и интеллектуальному анализу данных - KDD '09. п. 917. CiteSeerX  10.1.1.546.9358. Дои:10.1145/1557019.1557119. ISBN  978-1-60558-495-9. S2CID  1979173.
  6. ^ Лугхофер, Эдвин (февраль 2012 г.). «Гибридное активное обучение для уменьшения усилий операторов по аннотации в системах классификации». Распознавание образов. 45 (2): 884–896. Дои:10.1016 / j.patcog.2011.08.009.
  7. ^ Лугхофер, Эдвин (2012). «Однопроходное активное обучение с конфликтом и незнанием». Развивающиеся системы. 3 (4): 251–271. Дои:10.1007 / s12530-012-9060-7. S2CID  43844282.
  8. ^ Ван, Ляньтао; Ху, Сюэлей; Юань, Бо; Лу, Цзяньфэн (05.01.2015). «Активное обучение через синтез запросов и поиск ближайшего соседа» (PDF). Нейрокомпьютинг. 147: 426–434. Дои:10.1016 / j.neucom.2014.06.042.
  9. ^ Бунефуф, Джаллель; Ларош, Ромен; Урвой, Танги; Феро, Рафаэль; Аллезиардо, Робин (2014). «Контекстный бандит для активного обучения: Активный Томпсон». In Loo, C.K .; Yap, K. S .; Wong, K. W .; Teoh, A .; Хуанг, К. (ред.). Обработка нейронной информации (PDF). Конспект лекций по информатике. 8834. С. 405–412. Дои:10.1007/978-3-319-12637-1_51. ISBN  978-3-319-12636-4. Идентификатор HAL: hal-01069802.
  10. ^ Бунефуф, Джаллель (8 января 2016 г.). «Экспоненциальное исследование градиента для активного обучения». Компьютеры. 5 (1): 1. arXiv:1408.2196. Дои:10.3390 / компьютеры5010001. S2CID  14313852.
  11. ^ "шубхомойдас / ad_examples". GitHub. Получено 2018-12-04.
  12. ^ Макили, Ласаро Эмилио; Санчес, Хесус А. Вега; Дормидо-Канто, Себастьян (01.10.2012). «Активное обучение с использованием конформных предикторов: приложение к классификации изображений». Наука и технологии термоядерного синтеза. 62 (2): 347–355. Дои:10.13182 / FST12-A14626. ISSN  1536-1055. S2CID  115384000.
  13. ^ Чжао, Шуян; Хейттола, Тони; Виртанен, Туомас (2020). «Активное обучение для обнаружения звуковых событий». arXiv:2002.05033 [eess.AS ].

Другие ссылки