Классификатор ближайшего центроида - Википедия - Nearest centroid classifier

Классификация Роккио

В машинное обучение, а классификатор ближайшего центроида или же ближайший прототип классификатора это модель классификации который присваивает наблюдениям метку класса обучающих выборок, чьи иметь в виду (центроид ) наиболее близка к наблюдению.

Применительно к классификация текста с помощью tf * idf векторов для представления документов, ближайший классификатор центроидов известен как Классификатор Роккио из-за его сходства с Алгоритм Роккио за обратная связь по релевантности.[1]

Расширенная версия классификатора ближайшего центроида нашла применение в медицине, в частности, для классификации опухоли.[2]

Алгоритм

  • Процедура обучения: даны размеченные обучающие выборки с метками класса , вычислить центроиды для каждого класса куда - набор индексов выборок, принадлежащих к классу .
  • Функция прогноза: класс, присвоенный наблюдению. является .

Смотрите также

Рекомендации

  1. ^ Мэннинг, Кристофер; Рагхаван, Прабхакар; Шютце, Хинрих (2008). «Классификация векторного пространства». Введение в поиск информации. Издательство Кембриджского университета.
  2. ^ Тибширани, Роберт; Хасти, Тревор; Нарасимхан, Баласубраманиан; Чу, Гилберт (2002). «Диагностика нескольких типов рака по уменьшенным центроидам экспрессии генов». Труды Национальной академии наук. 99 (10): 6567–6572. Дои:10.1073 / pnas.082099299. ЧВК  124443. PMID  12011421.