Technorati 블로그 랭킹 개선

Technorati 블로그 검색서비스가 랭킹에서 Authority를 추가했다고 한다. “Technorati Authority is the number of blogs linking to a website in the last six months. The higher the number, the more Technorati Authority the blog has.” Authority를 6개월동안의 것만 취급하는구나. 좋은 아이디어 같다.(Authority는 HITS알고리즘의 개념이다. PageRank와 아주 유사한 알고리즘이다.) PageRank알고리즘도 저렇게 하면 오래된 문서가 계속 상위에 랭크되는걸 […]

계속 읽기

PageRank와 확률론

Google’s PageRank and Beyond를 보는데 역시나 선형대수학을 넘으니 이제는 확률론이 발목을 잡는다. 확률론은 기초적인 부분만 알지, 여기서 나오는 마르코프 체인 같은 부분은 잘 모른다. HMM에 대한 공부를 해봤지만 여기서 쓰이는 부분에 대한 지식이 없어서 마르코프 체인의 수렴 조건에 대한 이해를 잘 하지 못하고 있다. 그래서 책을 잡았다. (하지만 책도 마지막 쳅터에 이걸 다루고 있다는.. ㅡㅡ;) […]

계속 읽기

Google PageRank의 Personalization Vector

어제 구글이 개인의 선호도를 어떻게 랭킹에 반영하는지 알아냈다. 이름하여 개인화 검색의 구글버전이라고 해야하나? ㅎㅎ 위의 마지막 식에서 V^T라는 벡터가 개인화 랭킹을 위한 부분인데, Random Surfer가 주소를 직접 넣어서 페이지를 점프할때 적용이 되는 Vector이다. 이 부분을 모든 웹페이지가 동일한 확률로 점프를 한다는게 처음의 개념이다. 하지만 실제로는사람에게는 선호도라는게 있기 때문에 그렇게 하지 않는것이다. 그 벡터 자체가 선호도의 […]

계속 읽기

Deeper Inside PageRank

Google’s PageRank and Beyond책의 초안이라고 추정되는 논문 발견 논문은 책과 동일한 저자가 만들었고, 내용도 상당히 비슷하다. 물론 책이 더 상세하지만 말이다. Deeper Inside PageRank Amy N. Langville† and Carl D. Meyer∗

계속 읽기

Google PageRank 발표자료

금요일과 월요일 두번에 걸쳐 페이지랭크 알고리즘에 대한 발표를 마쳤다. 항상 생각하는건데 발표를 하고 나면 도리어 내가 얻는게 굉장히 많다. 그래서 무엇보다 나를 위한 발표가 아니였나 생각된다. ^^; 세미나를 함으로 잇점으로 생각되는 부분은.. 1. 발표직전까지 준비를 하면서 이게 정확히 이유가 뭔지 끊임없이 나에게 질문하게 된다. 2. 발표중에 돌발질문에 의해 세미나 참석자와 함께 고민하게 된다.(강의라는것과 다른점이라 하겠다.) […]

계속 읽기

Ruby로 짜본 구글 PageRank 알고리즘

오늘 집에 있으려니 좀이 쑤셔서 요즘 공부하고 있는 Ruby로 그동안 틈틈히 봐두었던 Google PageRank 알고리즘을 짜보았다. 물론 콘솔 기반으로 만들었고 이해하기 위해서는 약간의 링크 메트릭스에 대한 지식이 필요하다. 노드의 갯수? 이것은 웹문서의 갯수라고 생각하면 된다. 스샷에서는 3개라고 했으니 이 프로그램 전체에 있는 웹문서는 3개뿐이다. 이 3개 노드 사이에서 서로 링크에 관련된 정보가 필요한데 이것이 바로 […]

계속 읽기

웹 지도

전에 “링크“라는 책에서 웹의 지도라는 항목이 나왔었는데 이제서야 Google Pagerank 알고리즘을 분석하면서 웹 그래프를 보고 싶어 찾아봤다. from : http://mundi.net/maps/maps_020/ 정말 해파리 처럼 생겼군. ㅋ Munzner의 아이디어를 활용해 Hyun이 자바로 구현한 프로그램으로 만든 웹 그래프이다.(535,102노드와 601,678링크로 이루어 졌다.) 전체적인 웹의 지도를 의미하는건 아닌듯 하고 예제라고 하는데.. 아마도 이런부분에 대한 연구는 구글에서 하고 있지 않을까 한다.구글은 […]

계속 읽기

책 : Google PageRank and Beyond

Google PageRank and Beyond라는 책을 구입했다. 물론 conv2님과 서로 지르기 한 다음에 내가 하루 늦게 받았다. (아무래도 conv2님이 선수를 치신거 같다.ㅡㅡ;) 그래서 이 책의 서평은 conv2님에게 뺏겼지만 일단 한번 줄절대 보겠다. 따끈한 사진이다. 일단 페이지 랭크에 개인적인 관심은 별로 없었는데, 예전에 첫눈의 서울대학교 세미나때 강의 자료를 요청해서 보고 싶었는데 바로 거절당하는 바람에 구글의 페이지 랭크를 […]

계속 읽기