SpamBayes - SpamBayes
Оригинальный автор (ы) | Тим Питерс |
---|---|
изначальный выпуск | Сентябрь 2002 г. |
Стабильный выпуск | 1.0.4 / март 2005 г. |
Предварительный выпуск | 1.1a6 / 6 декабря 2008 г.[1] |
Написано в | Python |
Платформа | Кроссплатформенность |
Доступно в | английский Только |
Тип | Фильтрация электронной почты |
Лицензия | PSFL |
Интернет сайт | spambayes.sourceforge.net |
SpamBayes это Байесовский спам-фильтр написано в Python который использует методы, изложенные Пол Грэм в своем эссе «План борьбы со спамом». Впоследствии он был улучшен Гэри Робинсон и Тим Питерс, среди прочего.
Наиболее заметное различие между обычным байесовским фильтром и фильтром, используемым SpamBayes, состоит в том, что существует три классификации, а не две: спам, не-спам (называемый ветчина в SpamBayes) и не уверены. Пользователь тренирует сообщение как спам или любительское; при фильтрации сообщения спам-фильтры генерируют одну оценку для радиолюбителей и другую для спама.
Если оценка спама высокая, а оценка любительской почты низкая, сообщение будет классифицировано как спам. Если оценка спама низкая, а оценка ветчины высокая, сообщение будет классифицировано как ветчина. Если оценки высокие или обе низкий, сообщение будет классифицировано как неуверенное.
Такой подход приводит к небольшому количеству ложные срабатывания и ложные отрицания, но это может привести к ряду сомнений, требующих человеческого решения.
Веб-фильтрация
Была проделана некоторая работа по применению SpamBayes к фильтровать интернет-контент через прокси-сервер.[2][3]