Усредненные оценки с одной зависимостью - Averaged one-dependence estimators
Усредненные оценки с одной зависимостью (AODE) является вероятностным классификационное обучение техника. Он был разработан для решения проблемы независимости атрибутов популярных наивный байесовский классификатор. Он часто разрабатывает значительно более точные классификаторы, чем наивный байесовский классификатор, за счет небольшого увеличения объема вычислений.[1]
Классификатор AODE
AODE стремится оценить вероятность каждого класса у учитывая указанный набор функций Икс1, ... Иксп, П(у | Икс1, ... Иксп). Для этого используется формула
куда обозначает оценку , - частота, с которой аргумент появляется в выборке данных и м - указанная пользователем минимальная частота, с которой должен появляться термин, чтобы его можно было использовать во внешнем суммировании. В недавней практике м обычно устанавливается на 1.
Вывод классификатора AODE
Мы стремимся оценить P (у | Икс1, ... Иксп). По определению условной вероятности
Для любого ,
При предположении, что Икс1, ... Иксп независимы, учитывая у и Икся, следует, что
Эта формула определяет специальную форму Одной оценки зависимости (ODE), вариант наивный байесовский классификатор что делает вышеупомянутое предположение о независимости более слабым (и, следовательно, потенциально менее опасным), чем наивное предположение о независимости Байеса. Следовательно, каждое ОДУ должно создавать менее предвзятую оценку, чем наивный байесовский метод. Однако, поскольку каждая базовая оценка вероятности обусловлена двумя переменными, а не одной, они формируются из меньшего количества данных (обучающие примеры, удовлетворяющие обеим переменным) и, следовательно, вероятно, будут иметь большую дисперсию. AODE уменьшает эту дисперсию путем усреднения оценок всех таких ODE.
Особенности классификатора AODE
Как и наивный байесовский метод, AODE не выполняет выбор модели и не использует настраиваемые параметры. В результате он имеет низкую дисперсию. Он поддерживает постепенное обучение посредством чего классификатор может эффективно обновляться информацией из новых примеров по мере их появления. Он предсказывает вероятности классов, а не просто предсказывает один класс, позволяя пользователю определять уверенность, с которой может быть произведена каждая классификация. Его вероятностная модель может напрямую обрабатывать ситуации, когда некоторые данные отсутствуют.
AODE имеет вычислительную сложность во время тренировки и во время классификации, где п это количество функций, л количество обучающих примеров и k количество классов. Это делает его неприменимым к многомерным данным. Однако в рамках этого ограничения он является линейным по отношению к количеству обучающих примеров и, следовательно, может эффективно обрабатывать большое количество обучающих примеров.
Реализации
Свобода Weka Пакет машинного обучения включает реализацию AODE.
Смотрите также
Эта статья нужны дополнительные цитаты для проверка.Март 2011 г.) (Узнайте, как и когда удалить этот шаблон сообщения) ( |
Рекомендации
- ^ Уэбб Г. И., Дж. Ботон и З. Ван (2005). «Не такой уж наивный Байес: агрегирование оценок с одной зависимостью». Машинное обучение, 58(1), 5–24. Дои: 10.1007 / s10994-005-4258-6