Pagerank의 가장 큰 문제점은 좋은 글이 시간이 가면 갈수록 너무 유명해져서 새롭게 등장하는 좋은 글이 랭킹의 위로 올라갈 기회를 안준다는데 있다.
물론 구글에서도 이런것에 대한 개선사항이 있었겠지만, 어제 화장실에서 철학책을 뒤적이면서 링크 정보를 활용한 랭킹시스템에 위의 문제를 개선할 좋은 방법을 생각해 냈다.
상대적인것과 절대적인 것의 의미의 차이를 잘 생각해보면 알수 있다.
다만 구현상에 중요한것은 링크정보를 저장하는 데이터 스트럭처를 어떻게 구성하느냐인데, 이거 고민해 봐야겠다. (물론 그래프의 저장방법이 여러개 있지만(예. matrix) 이건 Sparse 해버리니 계산 복잡도도 꽤 되구. 공간 복잡도도 2^n으로 늘어나니 많은 데이터에서는 안습 ㅜㅜ)
BigTable이라는게 살짝힌트를 주긴 하지만 … 어쩌니… ㅡㅡ;
ps. 암튼 이 방법 형님에게 가서 한번 여쭤 봐야겠다.
pagerank 단점 보완할수 있을까? by from __future__ import dream is licensed under a Creative Commons Attribution-NonCommercial 4.0 International License.