Классификатор ближайшего центроида - Википедия - Nearest centroid classifier
В машинное обучение, а классификатор ближайшего центроида или же ближайший прототип классификатора это модель классификации который присваивает наблюдениям метку класса обучающих выборок, чьи иметь в виду (центроид ) наиболее близка к наблюдению.
Применительно к классификация текста с помощью tf * idf векторов для представления документов, ближайший классификатор центроидов известен как Классификатор Роккио из-за его сходства с Алгоритм Роккио за обратная связь по релевантности.[1]
Расширенная версия классификатора ближайшего центроида нашла применение в медицине, в частности, для классификации опухоли.[2]
Алгоритм
- Процедура обучения: даны размеченные обучающие выборки с метками класса , вычислить центроиды для каждого класса куда - набор индексов выборок, принадлежащих к классу .
- Функция прогноза: класс, присвоенный наблюдению. является .
Смотрите также
Рекомендации
- ^ Мэннинг, Кристофер; Рагхаван, Прабхакар; Шютце, Хинрих (2008). «Классификация векторного пространства». Введение в поиск информации. Издательство Кембриджского университета.
- ^ Тибширани, Роберт; Хасти, Тревор; Нарасимхан, Баласубраманиан; Чу, Гилберт (2002). «Диагностика нескольких типов рака по уменьшенным центроидам экспрессии генов». Труды Национальной академии наук. 99 (10): 6567–6572. Дои:10.1073 / pnas.082099299. ЧВК 124443. PMID 12011421.