- blogs:
- cles::blog
2020/11/16

さくらのレンタルサーバのスパムフィルタをチューニングする


さくらのレンタルサーバの SpamAssassin のベイジアンはデフォルトではあまり賢くないので、sa-learn*1 を使って学習させてみました。
さくらのレンタルサーバはほとんどの作業がウェブのコントロールパネルから実行できるようになっていますが、これについては ssh でターミナルから作業するしかないと思います。
† 作業方法
用意するものは、spam メールと spam でないメール(spam と対応させて ham と呼ばれます) の .eml ファイルを沢山用意しておきます。メーラーから Export しなくてもサーバ上にファイルが残っているのであればサーバ上のディレクトリを使うこともできます。例えば ~/MailBox/(ユーザー名)/maildir/cur や ~/MailBox/(ユーザー名)/maildir/new などにあるファイルを使うこともできます。これらのファイルには拡張子がついていませんが、中身は .eml と同じものです。
あとは sa-learn で以下のようなコマンドを実行するだけです。
(./spam や ./ham はメールが実際に入っているディレクトリに読み替えてください。)
sa-learn --spam --no-sync --progress ./spam
sa-learn --ham --no-sync --progress ./ham
sa-learn --sync
今回はそれぞれ2万件ずつ学習させたので、かなり良い精度で spam 判定できるようになりました。
トラックバックについて
Trackback URL:
お気軽にどうぞ。トラックバック前にポリシーをお読みください。[policy]
このエントリへのTrackbackにはこのURLが必要です→https://blog.cles.jp/item/12110
Trackbacks
このエントリにトラックバックはありません
Comments
愛のあるツッコミをお気軽にどうぞ。[policy]
古いエントリについてはコメント制御しているため、即時に反映されないことがあります。
古いエントリについてはコメント制御しているため、即時に反映されないことがあります。
コメントはありません
Comments Form
コメントは承認後の表示となります。
OpenIDでログインすると、即時に公開されます。
OpenID を使ってログインすることができます。
サイト内検索
検索ワードランキング
へぇが多いエントリ
閲覧数が多いエントリ
1 . アーロンチェアのポスチャーフィットを修理(114421)
2 . 福岡銀がデマの投稿者への刑事告訴を検討中(112944)
3 . 年次の人間ドックへ(112370)
4 . 2023 年分の確定申告完了!(1つめ)(111939)
5 . 三菱鉛筆がラミーを買収(111813)
2 . 福岡銀がデマの投稿者への刑事告訴を検討中(112944)
3 . 年次の人間ドックへ(112370)
4 . 2023 年分の確定申告完了!(1つめ)(111939)
5 . 三菱鉛筆がラミーを買収(111813)
cles::blogについて
Referrers