루씬(Lucene)을 분석하면서 여러 사이트를 검색해보고 메일링도 받아보고 그러는 중인데 의외로 자료가 적음에 실망을 했지만 조금이나마 힘이 될 수 있는 주소 몇개를 알아냈다.
더그 커팅의 블로그로 가보면 현재 그는 야후에서 일하고 있는것으로 나와있다. 그리고 간간히 여러 대학에서 정보검색에 대한 강의도 하고 있는거 같구, 따라서 강의 자료같은것도 부분이나마 다운받아서 볼 수 있다.
정보검색 자료들은 뭐 내내 검개그에서 조언해주었던 자료들이 대부분 포함되어 있다. 그리고 웹 자료들도 정리가 잘되어 있어 참고하는데 무리가 없을듯 하다.
마지막으로 루씬 메일링 리스트는 게시판 주소를 아예 링크를 걸어버렸는데 이곳에서 루씬 핵심 엔진을 만들었던 많은 사람들의 생각들을 엿볼 수 있다. 그리고 그들이 제시하는 참고 자료는 아주 유용하더라.
소스분석을 하는 와중에 외국 검색엔진의 색인DB가 왜 압축률이 좋은지 알 수 있었다.
쪼잔하고 잔머리 굴리는거 같아보일지 모르겠지만, 그들은 1Bit를 정말 소중이 여긴다는거를 알 수 있었다.
어떻게 하면 성능저하 없이 색인 용량을 줄일 수 있을까하는 고민의 흔적들이 소스 곳곳에 나와 있는걸 알 수 있었다.
분석 내내 머리가 답답하고 깨질거 같이 복잡했지만 얻는게 많은 분석작업 이였던거 같다.
드디에 파일시스템 강좌도 내일이 마지막이 될 거 같다.
유용한 자료 감사드립니다. 이번에 저도 세미나를 새로 시작하는데 루씬으로 할 것 같습니다.
고감자님의 자료가 유용할 듯 하네요 ㅋㅋㅋ
세미나로서 루씬 추천합니다.
하지만 문서만 보고서는 좀 힘들거라는 생각이 들구요. 꼭 소스분석도 해보시길 바랍니다. ^^