루씬 위키 페이지에 제 포스팅들이 올랐습니다.
Lucene 공식 Wiki에 내 블로그 포스팅들이 링크가 걸렸다. (by Jeon Hee Won ㅋㅋ) 의외로 수정 승인이 빨리 떨어져서 기분이 좋다. 블로그 테그에 걸린거라 좀 조심하면서 테깅을 해야할거 같다. 쩝 해당 페이지로 가기!
계속 읽기당신의 나의 뜨거운 감자!
Lucene 공식 Wiki에 내 블로그 포스팅들이 링크가 걸렸다. (by Jeon Hee Won ㅋㅋ) 의외로 수정 승인이 빨리 떨어져서 기분이 좋다. 블로그 테그에 걸린거라 좀 조심하면서 테깅을 해야할거 같다. 쩝 해당 페이지로 가기!
계속 읽기위의 두가지 식이 루씬에서 순위를 결정하는 식이 되겠다. 정확히 DefaultSimilarity라고 볼 수 있다.(현재 Lucene in Action 책의 식과 다르다.) 여기서 .f[0-9]* 라는 파일에 저장이 되는 값이 lengthNorm이라는 함수로 계산된 값인데. 식은 (float)(1.0 / Math.sqrt(numTerms)) 이와 같이 정의가 된다. numTerms은 해당 텀이 속해있는 Field의 Term의 갯수를 의미한다. 그래서 짧은 Field의 경우 굉장한 스코어상의 이득을 볼 수 […]
계속 읽기저기 네가 오고있다라는 책이다. 요즘 책사는데 투자보다는 전에 구한책들을 조금씩 다시 펼쳐보기 시작하고 있다. 이 책은 시멘틱웹:웹 2.0 시대의 기회라는 책에 대한 서평 이벤트시에 이벤트에 당첨이 되어서 받은 책이다. 별 기대없었구 수필이라서 처음부터 등외시 하던 책이였는데 가끔 화장실 갈때마다 가지고 다니다가 결국 책가방에 넣고 다니고 있다. 한동안 이 구절에 대해서 구구절절하게 공감했다. 사랑의 감정은 공유할 […]
계속 읽기예성 오카리나 Sop C키를 구매했다. 그 남자 그 여자를 연주하기 위해 급한 마음에 옥션에서 9900원 떨이 제품을 구매했다. 받아보니 정품이긴 한거 같은데 아직 연주는 못해봐서 소리 검증은 나중에 해야할거 같다. 예성 오카리나는 그나마 국내 공장(?) 생산 오카리나 중에서 제품의 음질이 믿을만 하다고 정평이 나 있다. 원래 정가가 3만원에 넘지만 옥션에서 아주 싸게 속는셈 치고 구매 […]
계속 읽기타인이 외로움을 잘 견딘다고 그 사람이 외로움을 덜 탄다고 생각되면 큰 오산이다. 그 사람은 그걸 다른 어떤 것으로 해소하는 방법을 알고 있거나, 최소한 표현을 안할 뿐이다. 단지 그 뿐이다. 타인이 잘 견뎌내 보인다고 절대 타인의 외로움의 강도를 섯불리 판단하려고 들면 안된다. 그렇게 판단하는건 자신의 외로움을 고집스런 방법으로 해소할 변명을 만들뿐이다. 한가지 분명한건 그 고집스런 해소방법은 […]
계속 읽기루씬 파일 포멧 두번째 강좌에서 .fnm파일을 설명하다가 FieldBits에 대한 설명을 얼렁뚱땅 해버려서 다시 자세히 설명한다. FieldBits 가장 낮은 비트는 인덱스 여부 저장 두번째 비트 term vector 저장 여부 세번째 비트 term positions 저장 여부 네번째 비트 term offsets 저장 여부 세번재, 네번째 비트를 왜 저장하는지 몰랐느데 겨우 알아넸다. 결론적으로는 세번째 비트는 구문질의나 스팬질의를 위한 정보를 […]
계속 읽기루씬 파일 시스템 두번째 강좌에서 증분색인(incremental indexing)에 대해서 약간이나마 설명을 했지만 뭔가 다른 설명할 거리가 필요함을 절절하게 느낀 나머지 “증분색인”에 대해서 다시 이야기 해보고자 한다. 루씬은 증분색인을 지원을 함으로서 색인에 문서를 추가했을 경우에 문서 전체를 재색인 할 필요가 없다. 따라서 문서가 추가된 다음에 즉시 검색이 가능하다는 이야기 이다. 그래서 색인에 문서가 추가될 때마다 색인이 있는 […]
계속 읽기이전 주소도 여전히 동작을 하게 했고, 새로운 도메인을 구매해서 운영하기로 했다. http://www.freesearch.pe.kr 워낙에 많은 분들이 왔다 갔다 해서 기억하기 좋은 도메인을 만들어 볼라고 한 5분 생각해보다가 위와같이 “자유로운 검색(free search)”으로 했다. 앞으로 검색엔진에 대한 많은 자료가 공유될 수 있도록 노력해야겠다.
계속 읽기