다음 커뮤니케이션에서 사내 세미나를 했을때 이분이 웹 스팸처리를 어떻게 할것인가 세미나를 하신적이 있었다.
끝나고 바로 세미나 내용을 정리 했어야 하는데, 쩝~~~~~ 아직 수첩에 남아 있는데 나중에 한번 정리 해봐야 겠다.
그때 생각나는 알고리즘은 TrustRank 알고리즘이다. 구글 페이징 랭크의 개념을 활용한 스팸처리 알고리즘..
이때 왜 마지막 식에서 dangling node에 대한 패널티를 주느냐? 하고 질문을 했었는데.. ㅎㅎㅎ
이 부분은 구글 페이지랭크 알고리즘에서 dangling node에 균일한 확률로 다른 페이지로 나가는 확률을 넣어주는 개념이랑 비슷하다는 생각이 든다.
둘다 dangling node에 랭킹이 집중되는걸 방지하기 위함이니까.
지금 생각하면 바보같은 질문이였지만 말이다. ^^;
신문 기사에서 본 내용이지만 실제 구글에서 개발을 하기도 하셨다니, 정말 대단하신 분이긴 한거 같다.
구글 검색엔진 개발에 참여한 한국인, 조정후 교수 by from __future__ import dream is licensed under a Creative Commons Attribution-NonCommercial 4.0 International License.