검색엔진 감동의 Architecture From : An Intorduction to Information Retrieval 최근에 논의된 개념들이 어느정도(?) 추가된 가장 최신의 검색엔진 Arcitecture다. 어제 책에 이 그림이 나오는것을 보고 감동을 먹었다. 이 글 공유하기: 클릭하여 친구에게 이메일로 링크 보내기 (새 창에서 열림) 전자우편 페이스북에 공유하려면 클릭하세요. (새 창에서 열림) Facebook 클릭하여 X에서 공유 (새 창에서 열림) X Threads에 공유하려면 클릭하세요. (새 창에서 열림) Threads LinkedIn으로 공유하기 (새 창에서 열림) LinkedIn 이것이 좋아요:좋아하기 가져오는 중...
나머지 부분은 대략 이해는 되는데… 진짜 모르겠는 부분이 있는데요. heap은 어떤 일을 하는 건가요? ㅡ,.ㅡ
대부분의 검색 결과는 모든 페이지를 다 보여주기 보다는 top k의 결과를 보여주죠.
구글의 경우는 10개 ….
50%가 넘는 사용자가 첫 페이지와 둘째 페이지만 본다고 하는 통계도 있고 하니 전체 다 소팅을 하는것은 리소스 낭비이고 response time의 손실도 있겠죠.
그래서 top k 개만 소팅하기 위해 heap 정렬 방법을 사용해 결과를 가져오게 됩니다.
감사합니다. ^^;
이런걸 보통 min heap같은걸 합니다.
고감자님, 개인적으로 궁금한 점이 있어 질문드립니다. 이전에 잠시 일하셨던 Daumsoft 는 업무가 어떤지요. 제일 궁금한 점은 회사 분위기입니다. 개발자들끼리 토론하며 기획도 함께 참여하며 개발해 나가는지.. 할당받은 업무만 하는지.. 검색 솔루션 업체지만 외부 SI프로젝트시에는 외부 투입되어 개발이 되는지 등.. 궁금한 점이 많습니다. (귀찮게 해드려 죄송합니다. 웹에서는 너무 회사 자료가 없어서요.)