검색에 대한 몇가지 정보 링크들

Comparing Google and Yahoo! Search Result구글과 야후의 검색 결과 링크 순위를 비교하는 페이지인데 사실 많은 분들이 모 그러려니 생각하겠지만 나에겐 이 두 검색 결과가 큰 의미를 가지고 있다. 2007년 구글  인덱스 사이즈2008년 구글 인덱스 사이즈 물론 구글의 인덱스의 크기도 큰 의미를 가지고 있긴 하다. 위 측정 방법이 어느정도 신뢰도가 있을지 모르겠지만 나름 쿼리를 조합해 저런방식으로 […]

계속 읽기

이제는 구글에서 고감자 바로가기

오우~~~ 내 블로그에 바로가기가 3개나 생겼다. 구글 정말 재밋는 회사네.. 가끔 이런 모습을 보면 놀랍고 재미있고 대단하다는 생각이 든다. 세밀한 검색 로깅으로 정확한 데이터를 뽑아 이들과 +a를 바탕으로 저런 똑똑하고 재밋는 검색을 보여주니 말이다.

계속 읽기

구글 코리아의 TNC인수

오늘 12시 TNC블로그에 대박 소식이 떴다. 앞으로 텍스트큐브를 사용하는 블로거로서 구글의 리소스를 활용한 스팸필터 업그레이드라든지 추가될 기능들이 매우 기대된다. (textcube.org의 가장 큰 스폰서는 구글이 되겠군.)그리고 구글이 그리고 있는 로드맵에서 텍스트큐브가 한몫 하기를 진심으로 기대한다. 개인적인 생각으로는 벤처하기 힘든 우리나라에서 구글에게 기술력을 인정받은 이런 벤처기업이 나왔다는 사실이 정말 기쁘다. 예전에 Eolin에서 구글에 데이터를 제공한다는 소문이 있어서 […]

계속 읽기

구글의 초대장은?

몇분 구글에서 초대 메일을 받으신분들이 있는데 그분들과 내가 받은 메일이 약간 내용이 다르다. 이분의 블로그를 보면 그 내용을 알 수 있는데, 이 메일에 대한 답장을 주면 초대메일을 보내 준다는 내용이 있는 반면에 내 메일에는 그런 내용이 없다.그럼 난 초대 메일 없이도 갈 수 있다는 이야긴가?  잘 모르겠군. 그리고 그것도 나에게는 행사 하루전에 메일을 보내서 참석 […]

계속 읽기

Google Developer Night 2008?

구글에서 메일이 왔다. 몇몇 분들에게만 보낸 모양인데, 아직 Google 한국 Office를 한번도 안가봐서 이번 기회에 가볼까 한다. 구글 Tech Talk가 저번 보다는 들을만 했으면 좋겠다. 이번 모임의 목적도 Recruiting인거 같다. (내 참석 목적은 다른거지만… ^^; )

계속 읽기

Google Developer Night 2007 참관 후기

Google Developer Night 2007에 다녀왔다. 사실 이런저런 상황으로 인해 늦는 바람에 갈까 말까 했지만 공짜 저녁의 유혹에 빠져 가고 말았다. 그리고 예전부터 구글 개발자 행사들이 어떻게 진행되고 구글의 문화는 어떤 느낌일까 굉장히 궁금했던 찰라여서 그런 궁금증 때문에 찾아 갔다. 가서 많은 분들을 만났다. 예전 직장 동료분들부터 해서 학교분들 그리고 기자님들까지… 구글의 저녁 대접은 생각보다 실망이였지만 […]

계속 읽기

구글 엔지니어에게 물어본것들

좀 오래(?) 전 이야기를 해보고자 한다. 한때 MapReduce니, GFS니 등 구글 기술에 관심이 많았던 때가 있었는데, 마침 구글직원을 만나서 논문을 보면서 궁금했던 것을 직접 물어볼 기회가 있었다. 질문들이다. 1. GFS에서 서버가 추가될때 데이터 레벨링이 어떻게 이루어 지는가?(논문에 자세한 내용이 나오지 않았다.) 답 : 5년전 페이퍼라서 지금 쓰는 구조와는 많은 차이가 있다. (답변을 하는 사람의 우월감을 […]

계속 읽기

Google PageRank의 Personalization Vector

어제 구글이 개인의 선호도를 어떻게 랭킹에 반영하는지 알아냈다. 이름하여 개인화 검색의 구글버전이라고 해야하나? ㅎㅎ 위의 마지막 식에서 V^T라는 벡터가 개인화 랭킹을 위한 부분인데, Random Surfer가 주소를 직접 넣어서 페이지를 점프할때 적용이 되는 Vector이다. 이 부분을 모든 웹페이지가 동일한 확률로 점프를 한다는게 처음의 개념이다. 하지만 실제로는사람에게는 선호도라는게 있기 때문에 그렇게 하지 않는것이다. 그 벡터 자체가 선호도의 […]

계속 읽기

구글 검색엔진 개발에 참여한 한국인, 조정후 교수

다음 커뮤니케이션에서 사내 세미나를 했을때 이분이 웹 스팸처리를 어떻게 할것인가 세미나를 하신적이 있었다. 끝나고 바로 세미나 내용을 정리 했어야 하는데, 쩝~~~~~ 아직 수첩에 남아 있는데 나중에 한번 정리 해봐야 겠다. 그때 생각나는 알고리즘은 TrustRank 알고리즘이다. 구글 페이징 랭크의 개념을 활용한 스팸처리 알고리즘.. 이때 왜 마지막 식에서 dangling node에 대한 패널티를 주느냐? 하고 질문을 했었는데.. ㅎㅎㅎ […]

계속 읽기

Google PageRank 발표자료

금요일과 월요일 두번에 걸쳐 페이지랭크 알고리즘에 대한 발표를 마쳤다. 항상 생각하는건데 발표를 하고 나면 도리어 내가 얻는게 굉장히 많다. 그래서 무엇보다 나를 위한 발표가 아니였나 생각된다. ^^; 세미나를 함으로 잇점으로 생각되는 부분은.. 1. 발표직전까지 준비를 하면서 이게 정확히 이유가 뭔지 끊임없이 나에게 질문하게 된다. 2. 발표중에 돌발질문에 의해 세미나 참석자와 함께 고민하게 된다.(강의라는것과 다른점이라 하겠다.) […]

계속 읽기