오픈소스 자바 검색엔진 Lucene

예전부터 Lucene에 대한 관심이 상당히 많아서 여러 문서들을 섭렵하던 때가 있었다.
어언 1년 전 이야기 인데.웹 로봇의 부재로 인해 많은 양의 데이터를 시험해 보지는 못했지만 검색엔진이 어떻게 돌아가게 되는지에 대해서 많은걸 알려주었던 오픈소스 프로젝트임에는 확실했다.

루씬 인 액션
예전에 이 책의 pdf 파일을 구해서 짬을 내 봤던 기억이 있는데 벌써 이런 책이 번역이 되어 나온다니 우리나라의 검색엔진 개발자로서 정말 감사할 따름이다. 책의 목차만 봤을때 How to use측면에서 다뤄진건 분명한데 오픈소스이니 Use측면에서 충분히 섭렵을 한 다음에 소스코드를 보면서 구현쪽을 찾아보면 아주 좋은 검색엔진 공부가 되지 않을까 한다.(이 방식이 많은 사람들이 오픈소스를 분석하는 방법이 아닐까 한다.)

물론 1년전 이야기 이지만 그때만 해도 오픈소스 한국어 형태소 분석기의 부재로 인해 Lucene의 한 카테고리 형식으로 오픈소스 형태소 분석을 수행해보고 싶은 욕망이 있었으나 해당 지식의 부재로 시도도 못해봤다. 지금은 약간 다른 이야기가 되고 있는건 사실이지만….ㅋㅋ (아직도 오픈소스 형태소 분석기는 없는것으로 안다.)

아직 오픈소스에 뛰어들만한 실력은 아니지만 아직까지 내가 뛰어들만한 여지는 있다는것에 안도를 일단한다.
오픈소스 검색엔진이 시장에 얼마나 많은 영향을 끼칠지는 모르지만 검색이라는게 엔진만 있어서는 안되는 분야라 이걸 가지고 사이트 검색엔진을 구축한다는건 상당한 무리가 갈거라는건 자명한 사실이다. 물론 Lucene소스를 꽤어 차고 있는 개발자라면 모를까…

아무튼 Lucene에 상당한 관심이 있는 나로서는 번역서가 나온건 쉽게 접근할수 있는 길이 생긴거나 다름없어서 기분좋을 따름이다.

물론 역자들도 실제 검색엔진을 개발하는 개발자라니 안심이 된다.

예약을 했으니 언젠가 오겠지… 오면 읽고 나서 또 포스팅을 하겠다.

CC BY-NC 4.0 오픈소스 자바 검색엔진 Lucene by from __future__ import dream is licensed under a Creative Commons Attribution-NonCommercial 4.0 International License.