Байесовский классификатор - Bayes classifier

В статистическая классификация, то Байесовский классификатор сводит к минимуму вероятность ошибочной классификации.[1]

Определение

Предположим, что пара принимает значения в , куда это метка класса . Это означает, что условное распределение из Икс, учитывая, что этикетка Y принимает значение р дан кем-то

за

куда ""означает" распространяется как ", и где обозначает распределение вероятностей.

А классификатор это правило, которое назначает наблюдение Икс=Икс предположение или оценка того, что ненаблюдаемая метка Y=р на самом деле было. Теоретически классификатор - это измеримая функция. , с интерпретацией, что C классифицирует точку Икс к классу C(Икс). Вероятность ошибочной классификации, или рисковать, классификатора C определяется как

Классификатор Байеса

На практике, как и в большинстве статистических данных, трудности и тонкости связаны с эффективным моделированием вероятностных распределений - в данном случае . Классификатор Байеса - полезный ориентир в статистическая классификация.

Избыточный риск общего классификатора (возможно, в зависимости от некоторых данных обучения) определяется как Таким образом, эта неотрицательная величина важна для оценки эффективности различных методов классификации. Классификатор называется последовательный если избыточный риск сходится к нулю, поскольку размер обучающего набора данных стремится к бесконечности.[2]

Доказательство оптимальности

Доказательство того, что классификатор Байеса оптимален и Коэффициент байесовских ошибок минимально происходит следующим образом.

Определите переменные: риск , Байесовский риск , все возможные классы, к которым могут быть отнесены точки . Пусть апостериорная вероятность точки, принадлежащей классу 1, равна . Определите классификатор в качестве

Тогда мы получаем следующие результаты:

(а) , т.е. классификатор Байеса,

(б) Для любого классификатора , то чрезмерный риск удовлетворяет

(c)


Доказательство (а): для любого классификатора , у нас есть

Заметь сводится к минимуму, принимая ,

Следовательно, минимально возможный риск - это риск Байеса, .


Доказательство (b):


Доказательство (c):


Общий случай, когда байесовский классификатор минимизирует ошибку классификации, когда каждый элемент может принадлежать любому из п категорий исходит из завышенных ожиданий следующим образом.

Это минимизируется путем классификации

за каждое наблюдение Икс.

Смотрите также

Рекомендации

  1. ^ Devroye, L .; Дьёрфи, Л. и Лугоши, Г. (1996). Вероятностная теория распознавания образов. Springer. ISBN  0-3879-4618-7.
  2. ^ https://dl.acm.org/doi/abs/10.1109/18.243433