Проблема почтового фильтрации, в частности, если речь идет о сервере провайдера, усложняется тем фактом, что выносить вердикт о том, какую почту доставлять абоненту, а какую нет, админ не может. На сегодняшний день существует ряд решений, которые позволяют пользователю самостоятельно принимать подобное решение. Одним из наиболее распространенных стала система фильтрации Spamassasin, которая способна сохранять настройки пользователя наряду с динамическими базами, которые применяются в SQL-базах данных при работе.
Аренда выделенного сервера
Используйте готовые решения, чтобы быстро подобрать оптимальный для себя вариант аренды сервера
Тем не менее, часто нам поступают вопросы о том, есть ли аналогичные решения, которые могут обладать более широким функционалом и/или быть более доступными в плане отладки. Безусловно, таких решений на сегодняшний день хватает. Основными конкурентами или аналогами Spamassasin в настоящее время можно назвать:
- Dspam;
- Spampal;
- ASSP;
- Postini;
- Bogofilter.
Сегодня предлагаем более подробно рассмотреть функционал таких решений, как Dspam и Spampal ставших для многих универсальным и надежным решением в борьбе со спамом.
Dspam
Как известно, сегодня существуют программы, которые используют для обозначенных выше целей возможности блокировки соединений входящих, построенные по принципу «черного» списка (например, Spamd). Для того чтобы понизить входящий почтовый трафик это более чем удачное решение. Но если речь идет о тех письмах, которые идут с новых адресов, не успевших «засветиться», то данный метод оказывается совсем неэффективным. Главное достоинство Dspam состоит в том, что она предоставляет достаточно широкие возможности персональной настройки для каждого из пользователей.Механизм работы: каким образом классифицируются письма?
Основным принципом, в соответствии с которым работает DSpam, является набор алгоритмов статистической аналитики. Такие алгоритмы основаны на теореме Томаса Байеса. По формуле из данной теоремы рассчитывается вероятность проявления того или иного события, которая находится в прямой зависимости от того, какова была вероятность проявления такого события раньше. Чтобы понять, как именно работает эта формула, рассмотрим типичный пример спам-письма, пришедшего на почту.Письмо с содержанием «Привет! Купи это». Одно из ключевых условий для выявления зависимости – количество раз, которое слова встречались в письмах с пометкой «спам» и «не спам»:
Слова Спам Не спам
Привет 54 79
Купи 120 18
Это 10 15
Сама формула выглядит следующим образом:
Р= S / (S + G)
Р – вероятно сообщение – спам;
G –коэффициент неспамовости сообщений в сумме;
S – коэффициент спамовости сообщений в сумме.
Для расчета G и Sприменяются следующие формулы:
G = (1 - p(w1))*(1 - p(w2))*:*(1 - p(wn));
S = p(w1)*p(w2)*:*p(wn).
А теперь применим эти формулы для выявления спама по Байесу с учетом имеющихся в сообщении слов:
р (Привет) = 54/(54 + 79) = 0,4;
р (Купи) = 120/(120 + 18) = 0,9;
р (Это) = 10/(10+15) = 0,4;
S = 0,4 * 0,9 * 0,4 = 0,14;
G = (1 – 0,4) * (1 – 0,9) * (1- 0,4) = 0,03;
Р = 0,14/(0,14 + 0,03) = 0,82.
ПО результатам приведенных данных получается, что полученное сообщение будет нежелательным с вероятностью в 82 процента по преимуществу из-за того, что слово «Купи» в данном случае имеет высокую спамовость.
Кроме приведенного выше алгоритма в программе задействован алгоритм вычисления спамовости Брайана Бартона, работающий по аналогичному принципу, но берущий на анализ вместо пятнадцати до двадцати семи слов с допущением удвоенного словарного использования в тексте (при условии, что слово встречается в письме не единожды). Использование такого алгоритма в определенной степени способствует повыщению эффективности в ограничении данных.
Вместе с тем здесь также применен формула Робинсона, усовершенствующая алгоритм Грэма с тем, чтобы позволить решать задачу в случае с недостатком данных по истории сообщений. Он предполагает, что если раньше слово, поддающееся анализу не было встречено, ему будет автоматом присвоен коэффициент 0,5.
Наконец, последний используемый в рамках DSpam алгоритм – усовершенствованная версия формулы Робинсона – формула Фишера-Робинсона, который еще также называется ChiSquare. Этот алгоритм помимо показателя спамовости позволяет определить, используя алгоритм Фишера, неспамовость.
В данном ПО применены все четыре формулы расчета. Стоит учитывать, что анализу подвергается не только тело, но также заголовки сообщений.
Интеграция Dspam с почтовыми системами
С почтовыми серверами Dspam можт взаимодействовать двумя путями. Первый вариант – настройка фильтра в качестве LDA (агента доставки), второй – работа в сочетании с proxy POP3. В первом случае сообщения будут анализироваться на пути MTA => почтовый ящик с завершением доставки после обработки LDA. Во втором отсеивание спама происходит, когда пользователи выкачивают из собственного почтового ящика полученные письма с использованием протокола РОР3.SpamPal
В своем классе данный продукт не только не уступает двум приведенным в пример выше, но и котируется многими сисадминами чуть ли не самым лучшим.Дистрибутив программы весит не более полумегабайта, и при таком достаточно малом весе данное ПО вмещает в себе огромное количество всевозможных функций, многие из которых становятся особенно поезными при ежедневной борьбой со спамом. Вместе с тем SpamPal – это свободно распространяемое ПО.
Принцип работы
После того, как SpamPal получает команду от почтового клиента на проверку поступившей корреспонденции, он соединится с сервером, загрузив письма из почтового ящика и идентифицировав некоторые из них, как спам. При этом они будут помечены соответствующим образом и отложены в папку-мусорник, при использовании стандартного инструментария в рамках самого почтового клиента.Для того чтобы отличить спамовое письмо от «нормального» программа руководствуется следующим особым принципом. Большинство спаммеров для рассылки незапрашиваемых рекламных писем пользуются специальными серверами, администраторы которых не стремятся к пресечению попыток рассылки рекламы и спама и не предпринимают мер для того, чтобы защитить сервер от того, чтобы к нему можно было подключиться удаленно для массовой почтовой рассылки. Серверы, разрешающие почту через себя кому заблагорассудится, называются открытыми релеями или базами ретрансляторов.
Такие релеи заносятся в DNSBL-списки, будучи уличенными в попытках спама. Такие базы постоянно обновляются. Собственно программа SpamPal использует большое число таких постоянно обновляющихся списков, сверяя в процессе проверки IP-адреса отправителей писем с адресами, которые присутствуют в таких базах. При обнаружении совпадения, письмо будет автоматически помечено как спам.
В настоящее время такой способ можно назвать одним из самых эффективных вариантов борьбы с почтовым спамом. Из недостатков можно отметить небольшое торможение при получении почты за счет использования списков DNSBL и использования расширяющих модулей (на один ящик приходится в среднем от 10 до 20 с задержек, что не так и критично).
Основные достоинства
Следует сразу оговориться: данная программа не может производить удаление писем прямиком с почтовых серверов. Однако говорить об этой особенности, как о недостатке, если даже и можно, то с определенными оговорками. Конечно такие функции доступны во многих аналогичных платных программах, однако даже если взять программу от того же Касперского AntiSpam, то она также не являются безупречными в этом плане решением. Даже несмотря на редкость возникновения ошибок, можно констатировать, что они случаются. Согласно статистике хотя бы одно письмо из 100 ошибочно будет распознаваться как спам. Причем это может быть крайне важная корреспонденция от партнеров по бизнесу, коллег и т.п. При этом можно сказать, что опция автоматического удаления писем с серверов зачастую расценивается пользователями, как приятное дополнение, нежели, как необходимый программный инструмент.Теперь несколько слов о неоспоримых преимуществах программы SpamPal. В первую очередь, программа достаточно часто обновляется и распространяется на бесплатной основе. На сайте разработчика вы всегда можете найти свежие версии программы.
Работать данное ПО может с любыми почтовыми клиентами.
Несмотря на широкий функционал, которым может похвастать SpamPal, его достаточно просто настроить (можно потратить не более двух минут при первой настройке почтового фильтра).
Наконец, здесь присутствуют возможности программного расширения, благодаря системе подключаемых модулей, которые также в большинстве своем можно найти в Интернете и скачать бесплатно.