В статистическая классификация, то Байесовский классификатор сводит к минимуму вероятность ошибочной классификации.[1]
Определение
Предположим, что пара принимает значения в , куда это метка класса . Это означает, что условное распределение из Икс, учитывая, что этикетка Y принимает значение р дан кем-то
- за
куда ""означает" распространяется как ", и где обозначает распределение вероятностей.
А классификатор это правило, которое назначает наблюдение Икс=Икс предположение или оценка того, что ненаблюдаемая метка Y=р на самом деле было. Теоретически классификатор - это измеримая функция. , с интерпретацией, что C классифицирует точку Икс к классу C(Икс). Вероятность ошибочной классификации, или рисковать, классификатора C определяется как
Классификатор Байеса
На практике, как и в большинстве статистических данных, трудности и тонкости связаны с эффективным моделированием вероятностных распределений - в данном случае . Классификатор Байеса - полезный ориентир в статистическая классификация.
Избыточный риск общего классификатора (возможно, в зависимости от некоторых данных обучения) определяется как Таким образом, эта неотрицательная величина важна для оценки эффективности различных методов классификации. Классификатор называется последовательный если избыточный риск сходится к нулю, поскольку размер обучающего набора данных стремится к бесконечности.[2]
Доказательство оптимальности
Доказательство того, что классификатор Байеса оптимален и Коэффициент байесовских ошибок минимально происходит следующим образом.
Определите переменные: риск , Байесовский риск , все возможные классы, к которым могут быть отнесены точки . Пусть апостериорная вероятность точки, принадлежащей классу 1, равна . Определите классификатор в качестве
Тогда мы получаем следующие результаты:
(а) , т.е. классификатор Байеса,
(б) Для любого классификатора , то чрезмерный риск удовлетворяет
(c)
Доказательство (а): для любого классификатора , у нас есть
Заметь сводится к минимуму, принимая ,
Следовательно, минимально возможный риск - это риск Байеса, .
Доказательство (b):
Доказательство (c):
Общий случай, когда байесовский классификатор минимизирует ошибку классификации, когда каждый элемент может принадлежать любому из п категорий исходит из завышенных ожиданий следующим образом.
Это минимизируется путем классификации
за каждое наблюдение Икс.
Смотрите также
Рекомендации