Когда моя почтовая установка обнаруживает, что почта является спамом, это помещает *SPAM*
в предмете. Теперь я хочу улучшить свой байесов фильтр по образованию это на моем корпусе спама.
Если я подаю эти тысячи писем к sa-learn
, будет та работа, даже если они все еще будут иметь *SPAM*
в предмете? Или это будет иметь эффект сообщения фильтра, “что-то - только спам, если это имеет *SPAM*
в заголовке”, который был бы контрпродуктивен?
Согласно странице руководства для sa-learn
, это будет нормально.
Если сообщения, из которых вы изучаете, уже были отфильтрованы через SpamAssassin учащийся компенсирует это. В результате, он узнает, как выглядело бы каждое сообщение, если бы вы запустили spamassassin -d заранее.