Существует ли способ заставить spamassassin выигрывать верхние строки тела сообщения в большей степени?

Много спама проходит через фильтр на почтовом сервере, который я выполняю с относительно простым приемом запуска с немногих строк (невероятно очевидный) потеря веса или другой текст жульничества наверху, сопровождаемый большим телом текста из документации по программированию — или, самый злой из всех, текст, очищенный от Exchange Стека. В лучшем случае Spamassassin рассматривает это как BAYES_50, и это происходит, что остальная часть сообщений создается достаточно тщательно, что они не поражают другие триггеры. (Например, заголовки минимальны и корректны.) Часто, включенные выборки выравниваются достаточно тесно с моими законными интересами, что сообщение в целом выиграно как BAYES_00, потому что очень спамные маркеры просто разбиты сочными самородками решения проблем системного администратора.

Верхняя часть так очевидно спамная (и на самом деле имеет тенденцию быть очень похожим на ранее полученный и обученный как сообщения спама), что я отчасти поражен, что она проходит — но ясно это. Это походит на отдельную передачу, которая выиграла лучшие 25 (или так) строки сообщения и весила, это в большой степени решит проблему. Существует ли способ сделать это?


Несколько человек предложили писать пользовательские регулярные выражения. Я не хочу входить в это, поскольку это - постоянное проигрышное сражение. Это - то, что сделали люди, прежде чем Байесовская сортировка спама вошла в широкое употребление, и это было обычно ужасно. Никакой человек не может поддержать на высоком уровне. Это не намного более эффективно, чем просто удар клавиши Delete для каждого сообщения спама и намного большего количества работы с моей стороны.

Работы байесовской фильтрации спама. Это даже работает над этим спамом, если я разделил "выше сгиба" часть и просто анализирую ту часть с ловушкой / удаленная дипольная помеха. Вопрос: как я могу заставить Spamassassin делать это?

9
задан 16 September 2014 в 16:16
1 ответ

Я сам (маленький) яркий борец со спамом. И из-за множества проблем, с которыми вы сталкиваетесь, я в конечном итоге сам делал грязные вещи много лет назад.

Теперь это не ответ на ваш конкретный вопрос, а ваша конкретная проблема. Поэтому, пожалуйста, не делайте из-за этого примечаний.

Как я решил эту проблему, я изменил скрипт sa_filter-post.pl, используемый почтовым сервером XMail, который вызывает спам в файле электронной почты и делает там некоторые мелкие вещи, чтобы обрабатывать не весь файл, а его отдельные части, основываясь на некоторых специфических правилах (жестко закодированных мной). Да, регексы, но пока они работают на меня (у меня есть куча других скриптов до и после этого, так что они могут играть определенную роль)

Например, у меня есть регекс, который вылавливает фоненумеры. Спамер оставил это в полном объеме, так что сразу же идет обрабатывать только середину 400 символов файла (я добрался до 400 с помощью проб и ошибок, на самом деле, начиная с 200). Обратите внимание, что довольно трудно выбрать середину того, что вы видите, по сравнению с тем, что в файле.

Есть еще один, который имеет такую же структуру html таблицы с "продуктами", фиктивный заголовок и не используемый нижний колонтитул, так что я вырезаю их, я вырезаю колонку комментариев "продукты" и затем передаю это спаму.

И так далее, вы получаете картинку.

Но не все правила идеальны, поэтому я делаю небольшое волшебство здесь, присваивая каждому правилу личный балл, который я жестко закодирую и настраиваю, когда это необходимо, в зависимости от того, как правило ведет себя (и иногда я в конце концов удаляю все правила). Затем я модифицирую оценку SA на личный счет. Причина, по которой я сделал это, была в том, что по каким-то причинам SA дал только баллы типа 4. что-то, чтобы наполнить явно спам на правила, что у меня также были сильные чувства, чтобы поймать их правильно. Так что я дал им небольшой толчок, чтобы они перешли на 5.0, в сочетании с некоторыми постобрабатывающими скриптами, которые принимают во внимание некоторые другие переменные (источник электронной почты, цель электронной почты, структура заголовка и т.д.), это более или менее убивает спам.

Теперь я понимаю, что это не то, на что вы надеялись, но в моем случае это дает мне большую власть над тем, что сканируется, это просто то, что мне нужно настроить вещи вручную, а затем время от времени делать небольшие корректировки значений/регексов.

Но в вашем случае все гораздо проще, так как все, что вам нужно сделать, это использовать простой сценарий bash, который будет вызван вашим MX вместо спама, и заставить этот сценарий использовать команду head, чтобы получить только первое нужное вам количество байт и передать этот временный файл спамку.

Содержимое сценария будет немного зависеть от вашего почтового сервера, но это не должно быть сложно выяснить.

(Обратите внимание, что я говорил так много о своей установке только для того, чтобы вы могли увидеть возможности этой опции)

PS: Лично я никогда не получал такого рода спам-письма (с программным обеспечением, связанным со спамом), так что мне интересно, не разозлили ли вы кого-нибудь, и не стали ли вы мишенью для этого. Это бы объяснило специально созданные письма. Причина, по которой я думаю об этой возможности, заключается в том, что много лет назад, когда я был очень активен на различных IT форумах и в различных группах, я выводил из себя некоторых людей, и время от времени я получал различные виды атак на свой сервер, включая почтовый спам. Но тогда идиоты были не настолько умны :)

.
1
ответ дан 2 December 2019 в 22:38

Теги

Похожие вопросы