SPAM画像考
SPAMに張り付いてきた画像を改めて見てみた。
ちなみに下記画像のファイル名は「o6h4rqb6qn.gif」
で、下記画像のファイル名は「sncjq18coz8sz2a.gif」
ファイル名もどうやらランダムに命名されているようだが、何より画像中にノイズを撒いている
あたりが手が込んでいる。
上記のノイズくらいであれば、画像認識で頑張れば文字判読くらいは大丈夫そうだが、
画像ファイルから(MD5などの)ハッシュ値を算出し、そのハッシュ値をフィルタでの
判定に用いるものだと、フィルタをくぐり抜けるのは簡単だろう。
いずれにせよ、ヘッダも含めたテキスト情報だけでSPAM判定を行うのは、精度のよい
結果が得られない段階を迎えたようだ。
ちなみに下記画像のファイル名は「o6h4rqb6qn.gif」
で、下記画像のファイル名は「sncjq18coz8sz2a.gif」
ファイル名もどうやらランダムに命名されているようだが、何より画像中にノイズを撒いている
あたりが手が込んでいる。
上記のノイズくらいであれば、画像認識で頑張れば文字判読くらいは大丈夫そうだが、
画像ファイルから(MD5などの)ハッシュ値を算出し、そのハッシュ値をフィルタでの
判定に用いるものだと、フィルタをくぐり抜けるのは簡単だろう。
いずれにせよ、ヘッダも含めたテキスト情報だけでSPAM判定を行うのは、精度のよい
結果が得られない段階を迎えたようだ。