Каково различие для spamassassin между использованием sa-learn и не использованием его?

Подробно остановиться на ответе Kieran (и да, который ЯВЛЯЕТСЯ вирусом),

  1. Удостоверьтесь, что Ваш вирус defs актуален и повторно сканирует
  2. Сделайте полное системное сканирование после обновления вируса defs
  3. Попробуйте другой инструмент сканирования, такой как Жало

1
задан 27 April 2011 в 12:09
3 ответа

sa-learn обычно используется для почты, сохраненной на машине (в mbox или maildir формате), и только работает при регистрации спама и ветчины отдельно. Если Вы собираетесь использовать его, это лучше всего используется с достойным количеством примеров обоих для предотвращения предвзятости фильтра.

существует хороший документ здесь, который проходит процесс и детали, но он действительно требует локально сохраненной почты (в любом формате).

сказав это, я использую SA на нескольких полях и никогда не использую sa-learn, и он все еще делает довольно хорошее задание. Я действительно использую много других методов против спама, которые не являются базирующимся SA, хотя...

4
ответ дан 3 December 2019 в 16:19

Я соглашаюсь с ответом Mark Regensberg, но быть более конкретным: насколько я понимаю sa-learn и другие Байесовские элементы SpamAssassin только влияют на Байесовские тесты (Вы видите текущий полный список тестов SA для разъяснения).

То есть все основанные на правилах тесты функционируют в полной эффективности независимо от того, используете ли Вы sa-learn или нет. Только соответствие BAYES_nn правила затронуты Вашим персонализированным обучением Байесовского механизма с sa-learn --ham и --spam.

Однако некоторые из тех тестов выигрывают вполне высоко - оценка сообщения может быть затронута суммой между-1.9 и +3.8, согласно тому, как "спамный" Байесовский механизм думает, что это - таким образом, я нахожу довольно много значения в предоставлении моего механизма некоторого обучения. Как Mark примечания, необходимо будет зарегистрировать ветчину и необнаруженный спам отдельно, чтобы сделать это.

В ответе на Ваше примечание, чтобы Mark, "другая" техника, которая уменьшила мой спам больше, чем кто-либо другой, является greylisting, который путем устранения почты "выпустил-забыл" уменьшил мой входящий спам на хорошо более чем 90%. Представление фильтрации SPF на входящей электронной почте было вторым самым эффективным, исключая приблизительно 5% из него.

4
ответ дан 3 December 2019 в 16:19

SpamAssassin имеет довольно много методик для поиска спама. Одной из них является его регулярное выражение (как отмечено в ответе MadHatter), но в наши дни оно не очень сильнодействующее. Другая (также отмеченная MadHatter) - SPF, хотя я бы назвал ее почти ничтожной с точки зрения ее способности поймать другой спам.

Самыми эффективными методами в SpamAssassin являются байесовское обнаружение и поиск в Интернете (DNSBLs (так же известный, как и "спам"). "RBLs) и URI DNSBLs, а также системы хэширования типа Razor и Pyzor, см. также вики-страницы SA для установки Razor и установки Pyzor).

Онлайн поиск, безусловно, самый простой; настройте их правильно, и вы готовы к работе. Они будут постоянно обновлять информацию о спаме, который попадает в различные сети спам- ловушек (honeypots), но они не защитят вас от снегоступов (которые слишком быстрые) или целенаправленных атак вроде spearphishing (который слишком мал).

Байесовское обнаружение требует постоянного обслуживания; это система машинного обучения, и, следовательно, она должна регулярно обучаться тому, что она пропустила (и что она нецелесообразно поймала). Чем больше внимания он получает, тем лучше.

SpamAssassin имеет систему автоматического обучения , которая предполагает, что весь спам с очень высокими баллами должен быть выучен как таковой, и все очень низкие баллы должны быть выучены как ветчина. Проблема в том, что он учится только из того, что легко, и (особенно для ветчины) может учиться из неправильно классифицированной почты, что усилит ошибки SpamAssassin.

Ни одно развертывание SpamAssassin никогда не должно доверять авто-обучению без дополнительного ручного обучения. Оно предназначено для дополнения ручного обучения, а не для его замены. Вы должны использовать sa-learn (или spaamAssassin --report, который также сообщает в Pyzor, Razor и SpamCop DNSBL).

Вы можете узнать больше о Bayes на вики-сайте SpamAssassin.

.
2
ответ дан 3 December 2019 в 16:19

Теги

Похожие вопросы