Множественное обучение - Википедия - Multiple instance learning

В машинное обучение, многократное обучение (MIL) - это тип контролируемое обучение. Вместо получения набора экземпляров, которые помечены индивидуально, учащийся получает набор помеченных сумки, каждый из которых содержит множество экземпляров. В простом случае с несколькими экземплярами двоичная классификация, пакет может быть помечен как отрицательный, если все экземпляры в нем отрицательны. С другой стороны, мешок считается положительным, если в нем есть хотя бы один положительный экземпляр. Из набора помеченных пакетов ученик пытается либо (i) создать концепцию, которая будет правильно маркировать отдельные экземпляры, либо (ii) научиться маркировать пакеты, не вводя концепцию.

Бабенко (2008)[1] дает простой пример для MIL. Представьте себе несколько человек, и у каждого из них есть связка ключей, содержащая несколько ключей. Некоторые из этих людей могут войти в определенную комнату, а некоторые - нет. Затем задача состоит в том, чтобы предсказать, сможет ли определенный ключ или определенная цепочка для ключей попасть в эту комнату. Чтобы решить эту проблему, нам нужно найти точный ключ, общий для всех «положительных» цепочек ключей. Если мы сможем правильно идентифицировать этот ключ, мы также сможем правильно классифицировать всю цепочку ключей - положительную, если она содержит требуемый ключ, или отрицательную, если нет.

Машинное обучение

В зависимости от типа и вариации обучающих данных машинное обучение можно условно разделить на три структуры: обучение с учителем, обучение без учителя и обучение с подкреплением. Множественное обучение (MIL) подпадает под структуру контролируемого обучения, где каждый обучающий экземпляр имеет метку, дискретную или действительную. MIL решает проблемы с неполным знанием этикеток в обучающих наборах. Точнее, при обучении с несколькими экземплярами обучающий набор состоит из помеченных «пакетов», каждый из которых представляет собой набор немаркированных экземпляров. Сумка помечается положительно, если хотя бы один экземпляр в ней является положительным, и помечается отрицательно, если все экземпляры в ней отрицательны. Цель MIL - предсказывать этикетки новых невидимых пакетов.

История

Keeler et al.,[2] в своей работе в начале 1990-х был первым, кто исследовал область МИГ. Сам термин «многоэкземплярное обучение» был введен в середине 1990-х годов Диттерихом и др. пока они исследовали проблему предсказания активности наркотиков.[3] Они попытались создать обучающую систему, которая могла бы предсказать, пригодна ли новая молекула для производства какого-либо лекарства, путем анализа набора известных молекул. Молекулы могут иметь множество альтернативных низкоэнергетических состояний, но только одно или несколько из них подходят для создания лекарства. Проблема возникла из-за того, что ученые могли только определить, пригодна ли молекула или нет, но они не могли точно сказать, какая из ее низкоэнергетических форм отвечает за это.

Один из предложенных способов решения этой проблемы состоял в том, чтобы использовать контролируемое обучение и рассматривать все низкоэнергетические формы квалифицированной молекулы как положительные обучающие примеры, в то время как все низкоэнергетические формы неквалифицированных молекул как отрицательные. Dietterich et al. показали, что такой метод будет иметь высокий ложноположительный шум от всех низкоэнергетических форм, которые ошибочно помечаются как положительные, и поэтому бесполезен.[3] Их подход заключался в том, чтобы рассматривать каждую молекулу как помеченный мешок, а все альтернативные низкоэнергетические формы этой молекулы - как экземпляры в мешке без индивидуальных меток. Таким образом формулируется обучение с несколькими экземплярами.

Решение проблемы многократного обучения, которую Dietterich et al. Предлагается алгоритм прямоугольника, параллельного оси (APR).[3] Он пытается найти подходящие параллельные оси прямоугольники, построенные объединением элементов. Они протестировали алгоритм на наборе данных Маска,[4] который представляет собой конкретные тестовые данные для прогнозирования активности наркотиков и наиболее часто используемый эталон в многоэкземплярном обучении. Алгоритм APR показал лучший результат, но APR был разработан с учетом данных Маска.

Проблема многокомпонентного обучения не уникальна для поиска наркотиков. В 1998 году Марон и Ратан нашли другое применение множественного обучения для классификации сцен в машинном зрении и разработали структуру Diverse Density.[5] Для данного изображения в качестве экземпляра берется одно или несколько субизображений фиксированного размера, а набор экземпляров - все изображение. Изображение считается позитивным, если оно содержит целевую сцену - например, водопад, - в противном случае - негативным. Многократное обучение можно использовать для изучения свойств фрагментов изображений, которые характеризуют целевую сцену. С этого момента эти структуры стали применяться к широкому спектру приложений, начиная от изучения концепции изображений и категоризации текста до прогнозирования фондового рынка.

Примеры

Возьмем, к примеру, классификацию изображений.Любовь (2013) Учитывая изображение, мы хотим узнать его целевой класс на основе его визуального содержимого. Например, целевым классом может быть «пляж», где изображение содержит и «песок», и «воду». В MIL термины, изображение описывается как мешок , где каждый вектор признаков (называемый пример) извлеченный из соответствующего -й регион на изображении и это общее количество регионов (экземпляров), разделяющих изображение. Сумка помечена положительный ("пляж"), если он содержит экземпляры области "песок" и области "вода".

Примеры применения MIL:

  • Молекулярная активность
  • Прогнозирование сайтов связывания Кальмодулин связывающие белки[6]
  • Функция прогнозирования альтернативно соединенных изоформ Ли, Менон и др. (2014),Экси и др. (2013)
  • Классификация изображений Марон и Ратан (1998)
  • Категоризация текста или документа Котзиас и др. (2015)
  • Прогнозирование функциональных сайтов связывания мишеней MicroRNA Bandyopadhyay, Ghosh & et al. (2015)
  • Классификация медицинских изображений Zhu et al. (2016), П.Дж. Судхаршан и др. (2019)

Многие исследователи работали над адаптацией классических методов классификации, таких как опорные векторные машины или же повышение, чтобы работать в контексте обучения с несколькими экземплярами.

Определения

Если пространство экземпляров , то набор сумок - это набор функций , которая изоморфна множеству мульти-подмножеств . За каждую сумку и каждый экземпляр , рассматривается как количество раз происходит в .[7] Позволять быть пространством подписей, тогда "концепция нескольких экземпляров" - это карта . Цель MIL - изучить такую ​​концепцию. В оставшейся части статьи мы сосредоточимся на двоичная классификация, куда .

Предположения

Большая часть работ по многократному обучению, включая Dietterich et al. (1997) и ранние статьи Марона и Лозано-Переса (1997),[3][8] сделайте предположение относительно связи между экземплярами в сумке и меткой класса сумки. Из-за своей важности это предположение часто называют стандартным предположением MI.

Стандартное предположение

Стандартное предположение берет каждый пример иметь связанный ярлык который скрыт от учащегося. Пара называется «концепцией уровня экземпляра». Сумка теперь рассматривается как мультимножество понятий уровня экземпляра и помечается положительным, если хотя бы один из его экземпляров имеет положительную метку, и отрицательным, если все его экземпляры имеют отрицательные метки. Формально пусть быть сумкой. Этикетка затем . Стандартное предположение MI является асимметричным, что означает, что если поменять местами положительные и отрицательные метки, предположение будет иметь другое значение. Из-за этого, когда мы используем это предположение, нам нужно четко понимать, какой ярлык должен быть положительным.

Стандартное предположение можно рассматривать как слишком строгое, и поэтому в последние годы исследователи попытались ослабить эту позицию, что привело к другим более свободным предположениям.[9] Причиной этого является вера в то, что стандартное предположение MI подходит для набора данных Маска, но, поскольку MIL можно применять к множеству других проблем, некоторые другие предположения, вероятно, могут быть более подходящими. Руководствуясь этой идеей, Вайдманн [10] сформулировал иерархию обобщенных предположений на основе экземпляров для MIL. Он состоит из стандартного допущения MI и трех типов обобщенных допущений MI, каждое из которых более общее, чем предыдущее, стандартное. на основе присутствия пороговый на основе подсчета, при этом предположение, основанное на подсчете, является наиболее общим, а стандартное предположение - наименее общим. Можно было бы ожидать, что алгоритм, который хорошо работает при одном из этих предположений, будет работать как минимум так же хорошо при менее общих предположениях.

Допущения на основе присутствия, пороговых значений и количества

Предположение, основанное на присутствии, является обобщением стандартного предположения, в котором пакет должен содержать один или несколько экземпляров, которые принадлежат набору требуемых концепций уровня экземпляра, чтобы быть помеченным как положительный. Формально пусть будет набором необходимых концепций уровня экземпляра, и пусть обозначают, сколько раз концепция уровня экземпляра происходит в сумке . потом для всех . Обратите внимание, что, взяв чтобы содержать только одну концепцию уровня экземпляра, предположение на основе присутствия сводится к стандартному предположению.

Дальнейшее обобщение связано с предположением, основанным на пороге, где каждая требуемая концепция уровня экземпляра должна встречаться не только один раз в сумке, но некоторое минимальное (пороговое) количество раз, чтобы сумка была помечена как положительная. С использованием обозначений выше для каждой требуемой концепции уровня экземпляра связан порог . Для сумки , для всех .

Предположение, основанное на подсчете, является окончательным обобщением, которое устанавливает как нижнюю, так и верхнюю границы количества раз, когда требуемая концепция может встречаться в положительно маркированном пакете. Каждая необходимая концепция уровня экземпляра имеет более низкий порог и верхний порог с . Сумка маркируется в соответствии с для всех .

Предположение GMIL

Скотт, Чжан и Браун (2005) [11] описывают еще одно обобщение стандартной модели, которое они называют «обобщенное многократное обучение» (GMIL). Предположение GMIL определяет набор необходимых экземпляров . Сумка считается положительным, если он содержит экземпляры, которые достаточно близки по крайней мере к требуемых экземпляров .[11] Только при этом условии предположение GMIL эквивалентно предположению, основанному на присутствии.[7] Однако Скотт и др. описать дальнейшее обобщение, в котором есть набор точек притяжения и набор точек отталкивания . Сумка считается положительной тогда и только тогда, когда она содержит экземпляры, достаточно близкие по крайней мере к точек притяжения и достаточно близки не более чем к точек отталкивания.[11] Это условие является строго более общим, чем условие, основанное на присутствии, хотя и не попадает в указанную выше иерархию.

Коллективное предположение

В отличие от предыдущих предположений, когда сумки считались фиксированными, коллективное предположение рассматривает сумку как распределение по экземплярам , и аналогично рассматривать метки как распределение по экземплярам. Таким образом, цель алгоритма, работающего при коллективном предположении, состоит в моделировании распределения .

С обычно считается фиксированным, но неизвестным, вместо этого алгоритмы сосредоточены на вычислении эмпирической версии: , куда количество экземпляров в сумке . С также обычно считается фиксированным, но неизвестным, большинство методов, основанных на коллективных предположениях, сосредоточены на изучении этого распределения, как и в версии для одного экземпляра.[7][9]

В то время как коллективное предположение оценивает каждый экземпляр с равной важностью, Фулдс расширил коллективное предположение, включив в него веса экземпляров. Взвешенное коллективное предположение состоит в том, что , куда является весовой функцией по экземплярам и .[7]

Алгоритмы

MIL Framework

Существует два основных вида алгоритмов для обучения множеству экземпляров: алгоритмы на основе экземпляров и на основе метаданных или алгоритмы на основе внедрения. Термин «на основе экземпляров» означает, что алгоритм пытается найти набор репрезентативных экземпляров на основе предположения MI и классифицировать будущие сумки по этим представителям. Напротив, алгоритмы на основе метаданных не делают никаких предположений о взаимосвязи между экземплярами и этикетками пакетов, а вместо этого пытаются извлечь независимую от экземпляра информацию (или метаданные) о мешках, чтобы изучить концепцию.[9] Обзор некоторых современных алгоритмов MI см. В Foulds and Frank. [7]

Алгоритмы на основе экземпляров

Самые ранние предложенные алгоритмы MI представляли собой набор алгоритмов «повторяющейся дискриминации», разработанные Диттерихом и др., И Diverse Density, разработанные Мароном и Лозано-Пересом.[3][8] Оба эти алгоритма работали при стандартном предположении.

Итеративная дискриминация

В целом, все алгоритмы повторной дискриминации состоят из двух фаз. Первый этап - выращивание прямоугольник, параллельный оси (APR), который содержит по крайней мере один экземпляр из каждого положительного пакета и ни одного экземпляра из любого отрицательного пакета. Это делается итеративно: начиная со случайного экземпляра в положительном пакете APR расширяется до наименьшего APR, охватывающего любой экземпляр в новой сумке позитива . Этот процесс повторяется до тех пор, пока APR не покроет хотя бы один экземпляр из каждого положительного пакета. Затем каждый экземпляр содержащемуся в APR присваивается «релевантность», соответствующая количеству отрицательных точек, которые он исключает из APR при удалении. Затем алгоритм выбирает репрезентативные экземпляры кандидатов в порядке убывания релевантности, пока ни один экземпляр, содержащийся в отрицательном пакете, также не будет содержаться в APR. Алгоритм повторяет эти этапы роста и выбора представителя до сходимости, где размер APR на каждой итерации считается равным только представителям кандидатов.

Предполагается, что после первой фазы годовая процентная ставка содержит только репрезентативные атрибуты. Вторая фаза расширяет этот жесткий APR следующим образом: гауссово распределение центрируется по каждому атрибуту, и рисуется более свободный APR, так что положительные экземпляры будут выходить за пределы жесткого APR с фиксированной вероятностью.[4] Хотя итерационные методы распознавания хорошо работают со стандартным предположением, они плохо переносятся на другие предположения MI.[7]

Различная плотность

В своей простейшей форме Diverse Density (DD) предполагает наличие единственного репрезентативного экземпляра. как концепция. Этот репрезентативный экземпляр должен быть «плотным» в том смысле, что он намного ближе к экземплярам из положительных сумок, чем из отрицательных сумок, а также «разнообразным» в том смысле, что он близок по крайней мере к одному экземпляру из каждого положительного пакета.

Позволять - набор положительно помеченных сумок, и пусть будет набором мешков с отрицательной маркировкой, то лучший кандидат в репрезентативный экземпляр дается , где разнообразная плотность при условии, что сумки распределяются независимо в соответствии с концепцией . Сдача обозначают j-й экземпляр bag i, модель noisy-or дает:

за масштабное расстояние куда - вектор масштабирования. Таким образом, если каждая положительная сумка имеет экземпляр, близкий к , тогда будет высоким для каждого , но если есть отрицательный мешок имеет экземпляр, близкий к , будет низким. Следовательно, высокий, только если каждый положительный мешок имеет экземпляр, близкий к и нет отрицательных сумок, близких к . Концепция кандидата можно получить с помощью градиентных методов. Классификация новых сумок может быть проведена путем оценки близости к .[8] Хотя Diversity Density был первоначально предложен Maron et al. в 1998 году более поздние алгоритмы MIL используют структуру DD, например EM-DD в 2001 году. [12] и ДД-СВМ в 2004 г.,[13] и МИЛИ в 2006 г. [7]

Ряд алгоритмов с одним экземпляром также был адаптирован к контексту с несколькими экземплярами в соответствии со стандартным предположением, включая

После 2000 года произошел отход от стандартного допущения и разработка алгоритмов, предназначенных для решения более общих допущений, перечисленных выше.[9]

  • Weidmann [10] предлагает алгоритм двухуровневой классификации (TLC) для изучения концепций в рамках предположения, основанного на подсчете. На первом этапе делается попытка изучить концепции уровня экземпляра путем построения дерева решений для каждого экземпляра в каждом пакете обучающего набора. Затем каждый пакет сопоставляется с вектором признаков на основе подсчетов в дереве решений. На втором этапе алгоритм единственного экземпляра запускается на векторах признаков, чтобы изучить концепцию.
  • Скотт и др. [11] предложил алгоритм GMIL-1 для изучения концепций в предположении GMIL в 2005 году. GMIL-1 перечисляет все параллельные оси прямоугольники в исходном пространстве экземпляров и определяет новый пространство функций булевых векторов. Сумка отображается на вектор в этом новом пространстве функций, где если годовая охватывает , и иначе. Затем можно применить алгоритм с одним экземпляром, чтобы изучить концепцию в этом новом пространстве функций.

Из-за высокой размерности нового пространства функций и стоимости явного перечисления всех APR исходного пространства экземпляров GMIL-1 неэффективен как с точки зрения вычислений, так и с точки зрения памяти. GMIL-2 был разработан как доработка GMIL-1 с целью повышения эффективности. GMIL-2 предварительно обрабатывает экземпляры, чтобы найти набор возможных репрезентативных экземпляров. GMIL-2 затем сопоставляет каждый пакет с логическим вектором, как в GMIL-1, но учитывает только APR, соответствующие уникальным подмножествам репрезентативных экземпляров кандидатов. Это значительно снижает требования к памяти и вычислительным ресурсам.[7]

  • Сюй (2003) [9] предложил несколько алгоритмов, основанных на логистической регрессии и методах повышения, для изучения концепций в рамках коллективного предположения.

Алгоритмы на основе метаданных (или встраивания)

Сопоставляя каждый пакет с вектором признаков метаданных, алгоритмы на основе метаданных позволяют гибко использовать произвольный алгоритм с одним экземпляром для выполнения фактической задачи классификации. Будущие пакеты просто отображаются (встраиваются) в пространство функций метаданных и маркируются выбранным классификатором. Следовательно, большая часть внимания в алгоритмах на основе метаданных делается на том, какие функции или какой тип внедрения приводят к эффективной классификации. Обратите внимание, что некоторые из ранее упомянутых алгоритмов, такие как TLC и GMIL, можно рассматривать как основанные на метаданных.

  • Один из подходов состоит в том, чтобы позволить метаданным для каждого пакета быть некоторым набором статистики по экземплярам в сумке. Алгоритм SimpleMI использует этот подход, когда метаданные пакета принимаются как простая сводная статистика, такая как среднее или минимальное и максимальное значение каждой переменной экземпляра, взятой для всех экземпляров в сумке. Существуют и другие алгоритмы, которые используют более сложную статистику, но SimpleMI оказался на удивление конкурентоспособным для ряда наборов данных, несмотря на очевидную несложность.[7]
  • Другой распространенный подход - рассматривать геометрию самих пакетов как метаданные. Это подход, используемый алгоритмами MIGraph и miGraph, которые представляют каждый пакет в виде графа, узлы которого являются экземплярами в сумке. Между двумя узлами существует граница, если расстояние (до некоторой метрики в пространстве экземпляров) между соответствующими экземплярами меньше некоторого порога. Классификация выполняется с помощью SVM с ядром графа (MIGraph и miGraph различаются только выбором ядра).[7] Аналогичные подходы используются MILES. [18] и MInD.[19] MILES представляет сумку по ее сходству с экземплярами в обучающей выборке, а MInD представляет сумку по расстояниям от других сумок.
  • Модификация k-ближайших соседей (kNN) также может считаться основанным на метаданных алгоритмом с геометрическими метаданными, хотя отображение между пакетами и функциями метаданных не является явным. Однако необходимо указать метрику, используемую для расчета расстояния между мешками. Ван и Цукер (2000) [20] предложить (максимальную и минимальную соответственно) метрики Хаусдорфа для сумок и :

Они определяют два варианта kNN, байесовский-kNN и citation-kNN, как адаптации традиционной задачи о ближайшем соседе к множеству экземпляров.

Обобщения

До сих пор эта статья рассматривала многократное обучение исключительно в контексте бинарных классификаторов. Однако обобщения двоичных классификаторов с одним экземпляром могут быть перенесены и на случай с несколькими экземплярами.

  • Одним из таких обобщений является проблема нескольких экземпляров нескольких меток (MIML), где каждый мешок теперь может быть связан с любым подмножеством пространства меток. Формально, если это пространство функций и пространство меток, концепция MIML - это карта . Чжоу и Чжан (2006) [21] предложить решение проблемы MIML путем сведения либо к проблеме нескольких экземпляров, либо к проблеме нескольких концепций.
  • Другое очевидное обобщение - это множественная регрессия. Здесь каждый мешок связан с одним действительным числом, как в стандартной регрессии. Подобно стандартному предположению, регрессия MI предполагает, что в каждом мешке есть один экземпляр, называемый «первичным экземпляром», который определяет этикетку для мешка (с точностью до шума). Идеальной целью регрессии MI было бы найти гиперплоскость, которая минимизирует потерю квадратов простых экземпляров в каждом мешке, но простые экземпляры скрыты. Фактически, Рэй и Пейдж (2001) [22] показать, что найти наиболее подходящую гиперплоскость, которая подходит для одного экземпляра из каждого мешка, невозможно, если в каждом мешке меньше трех экземпляров, и вместо этого разработайте алгоритм аппроксимации. Многие из алгоритмов, разработанных для классификации MI, также могут дать хорошее приближение к проблеме регрессии MI.[7]

Смотрите также

Рекомендации

  1. ^ Бабенко, Борис. «Множественное обучение: алгоритмы и приложения». Просмотреть статью PubMed / NCBI Google Scholar (2008).
  2. ^ Килер, Джеймс Д., Дэвид Э. Румелхарт и Ви-Кенг Леоу. Интегрированная сегментация и распознавание цифр, напечатанных от руки. Корпорация микроэлектроники и компьютерных технологий, 1991.
  3. ^ а б c d е Диттерих, Томас Г., Ричард Х. Латроп и Томас Лосано-Перес. «Решение проблемы нескольких экземпляров с помощью прямоугольников, параллельных оси». Искусственный интеллект 89.1 (1997): 31-71.
  4. ^ а б К. Блейк, Э. Кио и С. Дж. Мерц. Репозиторий баз данных машинного обучения UCI [1][постоянная мертвая ссылка ], Департамент информации и компьютерных наук, Калифорнийский университет, Ирвин, Калифорния, 1998.
  5. ^ О. Марон и А. Л. Ратан. Множественное обучение для классификации естественных сцен. В материалах 15-й Международной конференции по машинному обучению, Мэдисон, Висконсин, стр. 341–349, 1998.
  6. ^ Минхас, Ф. у. A. A; Бен-Гур, А (2012). «Множественное изучение сайтов связывания кальмодулина». Биоинформатика. 28 (18): i416 – i422. Дои:10.1093 / биоинформатика / bts416. ЧВК  3436843. PMID  22962461.
  7. ^ а б c d е ж грамм час я j k Фулдс, Джеймс и Эйбе Франк. «Обзор предположений об обучении с несколькими экземплярами». Обзор инженерии знаний 25.01 (2010): 1-25.
  8. ^ а б c Марон, Одед и Томас Лосано-Перес. «Фреймворк для множественного обучения». Достижения в системах обработки нейронной информации (1998): 570-576
  9. ^ а б c d е Сюй, X. Статистическое обучение в задачах с несколькими экземплярами. Магистерская диссертация, Университет Вайкато (2003 год).
  10. ^ а б Вайдманн, Нильс Б. «Двухуровневая классификация обобщенных многоэкземплярных данных». Дисс. Альберт-Людвигс-Университет, 2003.
  11. ^ а б c d Скотт, Стивен, Цзюнь Чжан и Джошуа Браун. «Об обобщенном многократном обучении». Международный журнал вычислительного интеллекта и приложений 5.01 (2005): 21-35.
  12. ^ Чжан, Ци и Салли А. Гольдман. «EM-DD: улучшенная методика обучения с использованием нескольких экземпляров». Достижения в области нейронных систем обработки информации. (2001): 1073 - 80
  13. ^ Чен, Исинь и Джеймс З. Ван. «Категоризация изображений путем обучения и обсуждения с регионами». Журнал исследований машинного обучения 5 (2004): 913-939.
  14. ^ Эндрюс, Стюарт, Иоаннис Цочантаридис и Томас Хофманн. «Поддержка векторных машин для обучения с несколькими экземплярами». Достижения в области нейронных систем обработки информации (2003 г.). стр. 561–658
  15. ^ Чжоу, Чжи-Хуа и Мин-Лин Чжан. «Нейронные сети для многоэкземплярного обучения». Труды Международной конференции по интеллектуальным информационным технологиям, Пекин, Китай. (2002). стр. 455–459
  16. ^ Блокил, Хендрик, Дэвид Пейдж и Ашвин Сринивасан. «Обучение множеству экземпляров дерева». Материалы 22-й международной конференции по машинному обучению. ACM, 2005. С. 57-64.
  17. ^ Ауэр, Питер и Рональд Ортнер. «Повышающий подход к обучению с несколькими экземплярами». Машинное обучение: ECML 2004. Springer Berlin Heidelberg, 2004. 63–74.
  18. ^ Чен, Исинь; Би, Дзинбо; Ван, Дж. З. (01.12.2006). «МИЛИ: обучение нескольких экземпляров с помощью выбора встроенного экземпляра». IEEE Transactions по анализу шаблонов и машинному анализу. 28 (12): 1931–1947. Дои:10.1109 / TPAMI.2006.248. ISSN  0162-8828. PMID  17108368.
  19. ^ Чеплыгина, Вероника; Налог, Дэвид М. Дж .; Луг, Марко (01.01.2015). «Множественное обучение с несходствами мешков». Распознавание образов. 48 (1): 264–275. arXiv:1309.5643. Дои:10.1016 / j.patcog.2014.07.022.
  20. ^ Ван, Цзюнь и Жан-Даниэль Цукер. «Решение проблемы с несколькими экземплярами: ленивый подход к обучению». ICML (2000): 1119-25
  21. ^ Чжоу, Чжи-Хуа и Мин-Лин Чжан. «Многоэкземплярное обучение с несколькими метками с применением классификации сцен». Достижения в системах обработки нейронной информации. 2006. С. 1609 - 16.
  22. ^ Рэй, Сумья и Дэвид Пейдж. «Множественная регрессия». ICML. Vol. 1. 2001. С. 425 - 32.

дальнейшее чтение

Недавние обзоры литературы по МИГ включают: