pagerank 단점 보완할수 있을까?

Pagerank의 가장 큰 문제점은 좋은 글이 시간이 가면 갈수록 너무 유명해져서 새롭게 등장하는 좋은 글이 랭킹의 위로 올라갈 기회를 안준다는데 있다.

물론 구글에서도 이런것에 대한 개선사항이 있었겠지만, 어제 화장실에서 철학책을 뒤적이면서 링크 정보를 활용한 랭킹시스템에 위의 문제를 개선할 좋은 방법을 생각해 냈다.

상대적인것과 절대적인 것의 의미의 차이를 잘 생각해보면 알수 있다.

다만 구현상에 중요한것은 링크정보를 저장하는 데이터 스트럭처를 어떻게 구성하느냐인데, 이거 고민해 봐야겠다. (물론 그래프의 저장방법이 여러개 있지만(예. matrix) 이건 Sparse 해버리니 계산 복잡도도 꽤 되구. 공간 복잡도도 2^n으로 늘어나니 많은 데이터에서는 안습 ㅜㅜ)

BigTable이라는게 살짝힌트를 주긴 하지만 … 어쩌니… ㅡㅡ;

ps. 암튼 이 방법 형님에게 가서 한번 여쭤 봐야겠다.

0 0 votes
Article Rating
Subscribe
Notify of
guest

3 Comments
Oldest
Newest Most Voted
Inline Feedbacks
View all comments
루미넌스

구글에서도 비슷한 문제로 고민을 많이 하고 있는 흔적이 종종 보입니다^^
훌륭한 랭킹모델을 만드시면 한수 가르쳐주세요~

최종욱

검색 결과 창에 ‘새로운 <----> 전통적인’ 슬라이드를 둬서 대충 훑어보는 것도 재미있을 것 같네요. 히히. 개발자 입장에서요.

내 블로그 내의 각 URL들의 구글 페이키랭크 값이 최근 바뀌었다.이미 널리 알려졌다시피, 구글은 검색결과 페이지를 보여줄때 어떤 기준에 의한 정렬(ordering)을 하는 대신, 모든 인덱스된 페이..