3段スパムフィルター
私のプライベートのメール環境は、具体的には明かせませんが、ISPのスパムフィルターとGmailのスパムフィルターを通し、さらにメーラーのスパムフィルターを通って届く経路をたどるので、1万通に1通通るか通らないかくらいの精度でスパムを除去できます。 ISPのスパムフィルターはノートンがベースのようですが、イマイチ精度が悪いもののルールを100個くらい記述できるので、スパムと認識してよいルールを70個近く記述してます。(数が多くなっちゃっている原因は正規表現が使えないためです。) ときどき(もうかなり使い込んでいるので月1回程度)記述したルールによって正常なメールが間違ってないかどうかスパムとして振り分けられてないかどうかチェックします。特にある有名なドメイン(福岡の球団です)からのメールはスパムが多いので、こちらで登録したアドレス以外は、自動的にゴミ箱送りなので、ゴミ箱あさりから始めます。新規に知り合いが増えない限り、それでも特に問題ないのです。これでかなりスパムを除去できます。
■こんな紛らわしいスパムも一発除去、ゴミ箱行き。
|
| |
ときどきチェックするとこんなメールがずらり。 文字化けも含む日本語以外のメールはまずここは通過できません。 ここでのルール違反ではないですが、「確認の方」というのはどうかと思う(笑) |
最終的に統計をとるために、簡単な正規表現でメールアドレスを拾ってます。 メールアドレスを拾うための正規表現:※完璧ではないです。 [a-zA-Z0-9_-]+\@[a-zA-Z0-9_-]+\.\w+ |
| これをさらにフィルタリングして、該当行を抜き出し、単語に分解して再度アドレスのみ抜き出して、ソートしてデータベースに格納してます。 |
| 固定リンク
★
お探しの情報が見つからなかったとき、サイト内検索をしてみて下さい。
コメント