« 完全定額制 MacOS対応 HSDPAデータ通信端末(USBモデムタイプ) | トップページ | スパイ大作戦(超小型インタビューレコーダー DVR-SP 他) »

2008/04/29

3段スパムフィルター

私のプライベートのメール環境は、具体的には明かせませんが、ISPのスパムフィルターとGmailのスパムフィルターを通し、さらにメーラーのスパムフィルターを通って届く経路をたどるので、1万通に1通通るか通らないかくらいの精度でスパムを除去できます。
ISPのスパムフィルターはノートンがベースのようですが、イマイチ精度が悪いもののルールを100個くらい記述できるので、スパムと認識してよいルールを70個近く記述してます。(数が多くなっちゃっている原因は正規表現が使えないためです。) ときどき(もうかなり使い込んでいるので月1回程度)記述したルールによって正常なメールが間違ってないかどうかスパムとして振り分けられてないかどうかチェックします。特にある有名なドメイン(福岡の球団です)からのメールはスパムが多いので、こちらで登録したアドレス以外は、自動的にゴミ箱送りなので、ゴミ箱あさりから始めます。新規に知り合いが増えない限り、それでも特に問題ないのです。これでかなりスパムを除去できます。

■こんな紛らわしいスパムも一発除去、ゴミ箱行き。
5
 
16 ときどきチェックするとこんなメールがずらり。
文字化けも含む日本語以外のメールはまずここは通過できません。
ここでのルール違反ではないですが、「確認の方」というのはどうかと思う(笑)
最終的に統計をとるために、簡単な正規表現でメールアドレスを拾ってます。
メールアドレスを拾うための正規表現:※完璧ではないです。
 [a-zA-Z0-9_-]+\@[a-zA-Z0-9_-]+\.\w+
これをさらにフィルタリングして、該当行を抜き出し、単語に分解して再度アドレスのみ抜き出して、ソートしてデータベースに格納してます。

| このエントリーを含むはてなブックマーク Yahoo!ブックマークに登録 livedoorブックマークに登録 fc2ブックマークに登録

お探しの情報が見つからなかったとき、サイト内検索をしてみて下さい。

サイト内検索

  • Google


    WWW を検索
    このサイト内を検索

コメント

コメントを書く




コメントは記事投稿者が公開するまで表示されません。