검색엔진 감동의 Architecture

최근에 논의된 개념들이 어느정도(?) 추가된 가장 최신의 검색엔진 Arcitecture다.

어제 책에 이 그림이 나오는것을 보고 감동을 먹었다.

0 0 votes
Article Rating
Subscribe
Notify of
guest

5 Comments
Oldest
Newest Most Voted
Inline Feedbacks
View all comments
jmirror

나머지 부분은 대략 이해는 되는데… 진짜 모르겠는 부분이 있는데요. heap은 어떤 일을 하는 건가요? ㅡ,.ㅡ

고감자

대부분의 검색 결과는 모든 페이지를 다 보여주기 보다는 top k의 결과를 보여주죠.

구글의 경우는 10개 ….
50%가 넘는 사용자가 첫 페이지와 둘째 페이지만 본다고 하는 통계도 있고 하니 전체 다 소팅을 하는것은 리소스 낭비이고 response time의 손실도 있겠죠.

그래서 top k 개만 소팅하기 위해 heap 정렬 방법을 사용해 결과를 가져오게 됩니다.

jmirror

감사합니다. ^^;

typos

이런걸 보통 min heap같은걸 합니다.

v쭌쓰v

고감자님, 개인적으로 궁금한 점이 있어 질문드립니다. 이전에 잠시 일하셨던 Daumsoft 는 업무가 어떤지요. 제일 궁금한 점은 회사 분위기입니다. 개발자들끼리 토론하며 기획도 함께 참여하며 개발해 나가는지.. 할당받은 업무만 하는지.. 검색 솔루션 업체지만 외부 SI프로젝트시에는 외부 투입되어 개발이 되는지 등.. 궁금한 점이 많습니다. (귀찮게 해드려 죄송합니다. 웹에서는 너무 회사 자료가 없어서요.)