cgem: я искал такую фильтровалку, а потом выяснилось, что в OSX оно встроено в его mail клиент. Ловит хорошо и начхать, что там спамер накарябал и какими буквами. Если ей указали, что "вот это" непонятно что спам, то это всеравно спам. И ловится он не по ключевому слову, а по совокупности многих факторов.
Попользовавался office 2004 там в почтовике тоже это появилось, хотя ловит немного похуже.
Один недостаток для многих письмо неоходимо скачать.
Попользовавался office 2004 там в почтовике тоже это появилось, хотя ловит немного похуже.
Один недостаток для многих письмо неоходимо скачать.
У моего брата начальник, когда получает письмо с вирусом или еще с чем, говорит:"Смотрите, помоему, это вирус. Так, сейчас запустим
Блин, смотритека, действительно вирус! Что же делать?" На полном серьезе запускает все вложенные в письмо файлы.
Очередная лентовская ерунда, помоему. Лично я использую DSPAM и очень доволен, за этот месяц наловил ~2000 писем. Аккуратность распознавания больше 99%, точнее не мерял.
А непонятно, собственно, чего же такого нового ребята из IBM придумали. Вот к Бату уже давно плагин есть, Фильтрация спама по Байесу. И все то же, в общем, каждому слову присваевается его рейтинг спамовости и на этом основании рассчитывается общая вероятность того, что письмо спам.
вы не понимаете, тут же алгоритм днк! это же биотехнологии, это будущее. в скором времени возле компьютера в стеклянно баночке будет лежать небольшой, размером с крысиный, мозг и питаться спамом. распознал жирует, не распознал голодает, не научился сдох. аналогичные устройства для распознавания сканированных текстов и вообще для делания разных дел. универсальная технология eDarvin, можно патентовать.
omant: Помоему, если в описании этого "алгоритма днк" заменить некоторые слова на другие, то получится вполне обычное описание стандартного алгоритма фильтра не первой свежести.
ты не учел, что ibm за год получает патентов больше всех компаний в мире.
это неспроста. нужно уметь сопоставлять данные.
это неспроста. нужно уметь сопоставлять данные.
omant: Я не спорю с тем, что IBM чтото там запатентовала. Но причем здесь биотехнологии совершенно не понимаю. Я даже сходил на сайт BBC за исходником этой новости. Там пишут, что он предназначен для "pattern discovery", и о том, что поиск повторяющихся фрагментов в ДНК и строчек в спаме это практически одно и то же. Да, в чемто они правы, но если я напишу тебе "чувак, я попробовал виагру, это круто!", то это еще не повод совать письмо в мусор. :)
Интересно, в Патентное Бюро много приходит спамовых патентов, и какой у них фильтр?
XSpamReport: Spam detection software has
identified this incoming email as possible spam.
Content analysis details: (6.0 points, 5.0 required)
pts rule name description
0.0 HTML_MESSAGE BODY: HTML included in message
1.1 RCVD_IN_DSBL RBL: Received via a relay in list.dsbl.org
[]
2.2 RCVD_IN_BL_SPAMCOP_NET RBL: Received via a relay in bl.spamcop.net
[Blocked see ]
2.5 RCVD_IN_DYNABLOCK RBL: Sent directly from dynamic IP address
[64.110.202.143 listed in dnsbl.sorbs.net]
0.1 RCVD_IN_SORBS RBL: SORBS: sender is listed in SORBS
[64.110.202.143 listed in dnsbl.sorbs.net]
identified this incoming email as possible spam.
Content analysis details: (6.0 points, 5.0 required)
pts rule name description
0.0 HTML_MESSAGE BODY: HTML included in message
1.1 RCVD_IN_DSBL RBL: Received via a relay in list.dsbl.org
[]
2.2 RCVD_IN_BL_SPAMCOP_NET RBL: Received via a relay in bl.spamcop.net
[Blocked see ]
2.5 RCVD_IN_DYNABLOCK RBL: Sent directly from dynamic IP address
[64.110.202.143 listed in dnsbl.sorbs.net]
0.1 RCVD_IN_SORBS RBL: SORBS: sender is listed in SORBS
[64.110.202.143 listed in dnsbl.sorbs.net]
acid232: ты же не думаешь, что IBM решила запатентовать сортировку по слову "виагра" в качестве спамового фильтра.
На примере плагина к Бату:
Статистическая фильтрация Байеса
Суть метода статистической фильтрации состоит в разбиении входящих писем на условные слова (токены), составлении частотного словаря таких токенов и применении математической теоремы Байеса к полученным наборам слов. Эта теорема позволяет вычислить вероятность успешного совершения некоторого события на основании статистики совершения этого события в прошлом. Применительно к фильтрации спама: если 9 из 10 писем, содержащих пресловутое слово "корова", являются спамом, и лишь одно — "хорошим" письмом, то теорема Байеса позволяет вычислить, с какой вероятностью следующее письмо, содержащее это слово, будет являться спамом.
На примере плагина к Бату:
Статистическая фильтрация Байеса
Суть метода статистической фильтрации состоит в разбиении входящих писем на условные слова (токены), составлении частотного словаря таких токенов и применении математической теоремы Байеса к полученным наборам слов. Эта теорема позволяет вычислить вероятность успешного совершения некоторого события на основании статистики совершения этого события в прошлом. Применительно к фильтрации спама: если 9 из 10 писем, содержащих пресловутое слово "корова", являются спамом, и лишь одно — "хорошим" письмом, то теорема Байеса позволяет вычислить, с какой вероятностью следующее письмо, содержащее это слово, будет являться спамом.
"Я попробовал Виагру!"(не импотент)
my_payne: Сейчас добавляют в СПАМ бесмысленный текс.
When alchemist beyond salad dressing returns home, trombone about burglar selfflagellates.near ocean borrow money from behind freight train, because insurance agent toward garbage can find subtle faults with turkey over.movie theater of cloud formation is sprightly.
Так что твой Байес идет лесом.
When alchemist beyond salad dressing returns home, trombone about burglar selfflagellates.near ocean borrow money from behind freight train, because insurance agent toward garbage can find subtle faults with turkey over.movie theater of cloud formation is sprightly.
Так что твой Байес идет лесом.
Ну не знаю, помоему, полностью избавиться от спама можно только одним способом: хорошо вести себя весь год, а потом обратиться к Деду Морозу.
Я получаю массу спама, где Viagra пишется, как Vi&gr&. Кроме того, можно спокойно менять буквы Х, О, Р, А, В, Т, Е, Н, К с русского на английский и наоборот. Кто это поймает?
днкдетектор поймает, он все ловит! ну, почти все. кроме наноспама.
у меня и моих корпоративных юзеров нет спама. совсем.
Важное письмо от хостера было расценено как спам и удалено!
cgem: Могу выслать примеры именно таких писем, которые успешно продетектированы как спам, так что лесом у меня идут именно спаммеры.
Ну и плюс greylisting + smtp callback на присылаемые адреса здорово помогает.
Ну и плюс greylisting + smtp callback на присылаемые адреса здорово помогает.
Ха! Байес вопервых умеет подставлять буквы из разных алфавитов (Например, анлийское О=русскому 0=нулю)
Ну и к тому же имеет грамотную опцию "пометить письмо как НЕ спам".
Если перестарается и какоенить письмо с заголовком "Re: запрос" окажется действительно ценным, есть шанс научить плагин не фильтровать такие письма
Ну и к тому же имеет грамотную опцию "пометить письмо как НЕ спам".
Если перестарается и какоенить письмо с заголовком "Re: запрос" окажется действительно ценным, есть шанс научить плагин не фильтровать такие письма

Боже, что же ждет тогда письма со словом "Уважаемый"?
в твиттер