루씬(Lucene)을 분석하면서 여러 사이트를 검색해보고 메일링도 받아보고 그러는 중인데 의외로 자료가 적음에 실망을 했지만 조금이나마 힘이 될 수 있는 주소 몇개를 알아냈다.
더그 커팅의 블로그로 가보면 현재 그는 야후에서 일하고 있는것으로 나와있다. 그리고 간간히 여러 대학에서 정보검색에 대한 강의도 하고 있는거 같구, 따라서 강의 자료같은것도 부분이나마 다운받아서 볼 수 있다.
정보검색 자료들은 뭐 내내 검개그에서 조언해주었던 자료들이 대부분 포함되어 있다. 그리고 웹 자료들도 정리가 잘되어 있어 참고하는데 무리가 없을듯 하다.
마지막으로 루씬 메일링 리스트는 게시판 주소를 아예 링크를 걸어버렸는데 이곳에서 루씬 핵심 엔진을 만들었던 많은 사람들의 생각들을 엿볼 수 있다. 그리고 그들이 제시하는 참고 자료는 아주 유용하더라.
소스분석을 하는 와중에 외국 검색엔진의 색인DB가 왜 압축률이 좋은지 알 수 있었다.
쪼잔하고 잔머리 굴리는거 같아보일지 모르겠지만, 그들은 1Bit를 정말 소중이 여긴다는거를 알 수 있었다.
어떻게 하면 성능저하 없이 색인 용량을 줄일 수 있을까하는 고민의 흔적들이 소스 곳곳에 나와 있는걸 알 수 있었다.
분석 내내 머리가 답답하고 깨질거 같이 복잡했지만 얻는게 많은 분석작업 이였던거 같다.
드디에 파일시스템 강좌도 내일이 마지막이 될 거 같다.
루씬에 대해서 몇가지… by from __future__ import dream is licensed under a Creative Commons Attribution-NonCommercial 4.0 International License.