참.. 날이 가면 갈수록 교묘해 진다.
같은 IP의 반복을 카운팅해서 스팸을 막는다고 해고 이렇게 다양한 IP대역으로 들어오니 또한 링크를 몰아주는 Porn사이트도 정말 다양하게 보내줬다. 허허
여기서 가장 잘 알수 있는 공통적인 사실은 모든 URL을 Porn사이트로 몰아간다는건데 그럼 막기 위해서 링크를 따라서 링크를 한 페이지의 Porn을 판단해야 한다는건데 그렇다면 또 여기서 새로운 논문거리가 하나 나오는군.
대상 사이트를 대강 분석해 보니 대표적인 상업용 키워드하고 Porn성 키워드가 많이 나오는걸 알수 있다. 그럼 일단 이 스팸들을 지우지 말고 다운 받아서 링크된 사이트를 파싱해보는 작업을 해봐야 겠다.
어찌보면 이런 스팸덧글도 귀중한 자료가 아닐수 없군.
제대로 되면 스팸 차단 기술이 한세대 진보하겠군요.
원천적으로 분석해서 차단하는거니 아주 기대됩니다.
제 경우는 거의 게시판에 스팸 댓글로 친절하게 그 사이트로 오시라고 남기더군요. 그것도 특정 게시물에 한해 계속 저러고 있습니다. 이 점에 착안해, 역으로 각 IP를 일일이 막는 대신 IP 대역을 통한 필터링을 가했습니다. 그러더니 이제야 잠잠해진듯…
현재, 약 17,000 개에다가 대역까지 고려하면 한 20,000 개 정도로 해당 IP를 차단하고 있습니다. 다소 무식한 방법이지만, 게시판에서 제공하는 IP 필터링이 고전적이니 어쩔 수 없죠. 언제쯤이면 스팸이 없는 세상이 올까요? ^^;
Redirection을 이용한 스팸 광고 detection
링크를 돌려치기 하는 수법
즉, 일반적인 URL 링크로 보이는 1차 링크가 달린 글을 덧글이나 블로그에 포스팅을 하고
2차, 3차, n차를 거쳐서 최종 target page…