ネットワーク管理者の憂鬱な日常

とある組織でネットワーク管理に携わる管理者の憂鬱な日常を書いてみたりするブログ

SPAM画像考

SPAMに張り付いてきた画像を改めて見てみた。

ちなみに下記画像のファイル名は「o6h4rqb6qn.gif」


で、下記画像のファイル名は「sncjq18coz8sz2a.gif」


ファイル名もどうやらランダムに命名されているようだが、何より画像中にノイズを撒いている
あたりが手が込んでいる。

上記のノイズくらいであれば、画像認識で頑張れば文字判読くらいは大丈夫そうだが、
画像ファイルから(MD5などの)ハッシュ値を算出し、そのハッシュ値をフィルタでの
判定に用いるものだと、フィルタをくぐり抜けるのは簡単だろう。

いずれにせよ、ヘッダも含めたテキスト情報だけでSPAM判定を行うのは、精度のよい
結果が得られない段階を迎えたようだ。

スポンサーリンク