Lucene에서 variable int 표현하는법

오늘 Lucene에서 쓰이는 인덱스 시스템을 분석하면서 Vint 타입을 어떻게 처리하는지 코드를 분석해봤다. int면 int지 왜 Vint인지, 예전에 DB를 공부하면서 vchar타입인가? 하는 V자가 붙은 타입을 봤는데, 이 것들의 설명이 그 대상체의 크기에 맞게 disk에 공간을 차지한다는 개념이였다. 물론 Lucene도 마찬가지로 이 부분에 대해서 고려한 부분이 있었다. 이 코드를 이해하고 ‘아~!’ 하고 머리를 쳤으니 참 기쁘기 한량없었다. […]

계속 읽기

돈 하나도 안들고 구글의 상위에 랭크시키는 방법

이 블로그의 랭크가 급격하게 올라가게된 시점이 딱 대학원에서 열심히 레포트를 한 다음에 그 레포트에 대한 FeedBack을 블로그 포스팅으로 올린 후 부터였으니까. 구글에서 한글 사이트만으로 특정 키워드 “비터비(Viterbi)”, “Decision Tree”, “boyer-moore”, “k-means” 으로 치면 바로 1위에 랭크가 되버린다. 하긴 내가 글을 쓰기전에 볼만한 페이지가 없던것도 사실이다. 그리 전문적인것이 부재한곳인 이 인터넷이라는 공간이니, 그 부분만 공략한다면 쉽게(?) […]

계속 읽기

동생이 체신청에 합격했습니다.

일주일 되었는데, 아직까지 그때의 기분이 가시지 않는다. 저번주 월요일 발표를 했는데 말이다. 그놈이 면접을 볼때 내가 어찌나 긴장을 했는지, 집에다 연신 전화를 하고 잘 봤냐는 이야기를 수도없이 물어봤으니까. 결과가 나왔다. “제 하나밖에 없는 여동생이 체신청에 합격했습니다.” 무척 기쁘다. 아마 본인의 맘 고생이 정말 심했을 꺼라는 생각을 해본다. 모든 가족이 이 문제로 함께 고민하고 서로 맘상하는 […]

계속 읽기

Lucene 파일 시스템 공부하기

오늘도 도서관에 왔는데, 하고자 한 논문번역은 뒤로 하고 루씬(Lucene)의 파일시스템 분석하고, Lupy 소스 분석을 하고 있다. Lupy는 Lucene의 Python구현버전으로 1.2 까지의 기능을 구현하고 있다. 솔직히 이 Lupy를 실제 쓰려고 하는건 아니고, Lucene을 분석하기가 좀 버거워서 읽기쉬운 Lupy를 선택해서 보고 있었다. 역시나 그런데 소스를 보자니 좀 복잡하긴 하다. 전체적으로 역파일 구조로 되어 있는건 알겠는데, 소스 한줄한줄 […]

계속 읽기

최저가 무선 공유기 구매

집에 데스크탑 1대가 있고, 항상 가지고 다니는 나의 노트북이 있다. 항상 집에서 노트북을 써야만 되는 상황이 되어서는 무선랜의 압박이 심했다. 몇일전 집에서 논문번역을 하는데, 노트북으로 계속 작업환경을 맞춰놓은 상태라 인터넷으로 구동되는 사전 프로그램을 연동시키기 힘들어 케이블 모뎀에서 나오는 랜선을 꽂아서 사용했다. 항상 이런식이다. 자주 쓰지는 않지만, 있으면 좋을텐데.. 하면서 구입을 수십번을 망설였다. (한번은 샵에서 주문을 […]

계속 읽기

조금은 무계획적으로 살아보자 했지만…

2006년 1월달부터 주창하던 나의 임시 신조가 있다. “계획대로 살지 말자!” 너무 계획대로 살다보니 주변에서 “너무 딱딱하게 사는거 아니냐?”, 또는 “너무 빡시게 산다.”, 아니면 “넌 사람도 아니야!” 하는 가슴아픈 이야기들을 많이 한다. 그래서 다시 인간이 되보고자 1, 2월달은 좀 느슨하게 살아봤다. 그래도 이 그림 정도는 아니였다. 그냥 주말에 도서관가서 논문번역 5장 하기로 했다면, 대충 2장만 하고 […]

계속 읽기

진짜 프로라면 자신의 일을 선택, 선별할줄도 알아야 한다.

고작 2년의 실무경력을 가진 내가 이런말을 한다면 어처구니 없다고들 이야기 할수 있겠지만, 일단 내 블로그이니 내 맘대로 글을 써보겠다. 그리고 의견이 있으면 자신있게 댓글을 달아주시면 좋겠다. 일이 즐거운 사람이 성공할 가능성이 많다고 한다. 그리고 일이 즐거우려면 그 일에 부여할수 있는 가치가 있어야 한다. 그게 먹고 살기위한 가치가 아니라, 이 일을 함으로서 미래에 내가 뭐가 달라질것이냐 […]

계속 읽기

발렌타인 데이, 회사, 사우회

정말 아침에 웃겨서 자빠지는줄 알았다. 사우회 임원을 잘 뽑은건지 아닌건지…., 재미나기도 하고, 우울하기도하고, 비참하기도 하고… 이런 복합적인 감정상태를 한마디로… “미치겠군” 초콜릿이 아주 미워보이기는 이번이 처음이다. 2006년 2월 14일 아주 잊지못할 추억을 안겨준 “사우회”야 고맙다. [#M_ 이어지는 내용 | 글 닫기 | 사 우 회 (읽기가 무척 힘들었다.) 우울하군 ㅜㅜ 어째 오늘 연차를 내고 싶었는데….. 낼껄…_M#]

계속 읽기

String Matching 알고리즘

String Matching 알고리즘을 요즘 좀 보고 있어서 정리했본다. 먼저 Naive String Matching 알고리즘이다. 일반적인 String Matching 알고리즘 이다. 누구든지 C로 구현을 한다고 하면, 처음엔 이런식으로 구현을 할것이다. 하지만 이 알고리즘은 상당한 단점을 가지고 있다. 무식하게 처음부터 1씩 증가하면서 모든 경우를 타진하는 알고리즘이기때문이다. 이를 보완한 알고리즘이 Boyer-Moore String Matching 알고리즘이다. 위의 알고리즘에서 x 는 Keyword가 되겠고, […]

계속 읽기

오~~~ 장사장님..

아스피린 하우스의 글에서 트랙백 했다. 언제나 검색의 특수성을 대변해 주시는 장사장님 좋아요. 장사장님은 최고의 개발자들과 10개월여의 개발기간 동안 검색일을 하면서, 항상 미디어를 통해 검색의 애로사항들을 잘 이야기해주는거 같다. 중요한거는 항상 정말 맞는 이야기만 해주신다는것이다. 이 글에서 검색엔진 개발은 고급인력이 필요한 부분이라는거 정말 정말 인정한다. 다만 이 부분을 윗분들이 몰라서 그렇지만 말이다. 하지만, 첫눈의 장사장님은 이 […]

계속 읽기