MS의 새로운 검색엔진 Windows Live Search

MS가 Google에 맞서시 위해 출시하려고 하는 Windows Live Search의 모습이 서서히 드러나고 있다. 아쉽게도 한글은 지원을 안한다. 그러나, 역시나 MS다. 인터페이스가 내가 봤을때는 유치원생도 쓸수 있게 구성을 해놓았다. 검색결과를 Simple 에서 Detail로 조절해서 볼수 있는, 상단 바가 존재하고, Detail쪽으로 바를 옮겨 바로 사이트 내 검색을 할수 있다. 그리고 또한 검색결과를 위한 스크롤바나 페이징 기능을 제공하지 […]

계속 읽기

어제 정보검색 + 인공지능 수업후기

으앗! 드디어 임해창 교수님의 수업을 듣게 되었다. 딱 강의하기 좋은 분위기로 만들어 주시고, 학생을 위한 배려또한 남달랐다. 역시 기대한 만큼 나에게 부담도 많이 주시더라. 인공지능 숙제로 “대화형 에이전트”를 만들어 보라고 하셨다. 대화형 에이전트를 검색과 연계한 서비스가 벌써 나오고 있는 찰라에 그걸 만들어볼 기회만 노리고 있었는데, 특별히 숙제를 내주신단다. 일단 능력이 되던 안되던, 해보고 싶다고 말씀은 […]

계속 읽기

단지 음악이 좋기때문에 미니홈피를 방문한다.

검색엔진 개발자 그룹에서 유흥부장님으로 활동하시며, 자랩을 운영하시고 또한 자갸.com을 운영하시는 유흥부장님께서 얼마전 뮤직 서비스를 오픈해서 그에 대한 포스팅을 하고자 한다. 자갸 뮤직 서비스인데, 싸이월드의 미니홈피 배경음악을 검색해서 제공하는 서비스 이다. 일단 검색결과의 정확성이 뛰어 나다. 형태소 분석을 어떻게 하셨는지는 오프모임때 물어봐야 하겠지만, 복합명사 처리라든지 하는 부분이 꽤 정확하게 나온다. 검색속도도 빠르고, 나무랄데 없다. 단지 전문 […]

계속 읽기

Unicode와 UTF-8의 차이점이란?

오늘 열렬히 코드를 보고 있다가 유니코드(Unicode) 복원 부분에 대한걸 봤다. 역시나 Lucene코드를 뒤져보다 나온 내용이다. Lucene은 디폴트로 유니코드셋을 쓴다. 그러니 UTF-8은 피할수 없이 꼭 거쳐가야만 될 부분이였다. 일단 코드는 이렇다. (역시 Python 코드 ㅋㅋ) def readChars(self, length):    buffer = []    for i in range(length):        b = self.readByte()        […]

계속 읽기

Lucene에서 variable int 표현하는법

오늘 Lucene에서 쓰이는 인덱스 시스템을 분석하면서 Vint 타입을 어떻게 처리하는지 코드를 분석해봤다. int면 int지 왜 Vint인지, 예전에 DB를 공부하면서 vchar타입인가? 하는 V자가 붙은 타입을 봤는데, 이 것들의 설명이 그 대상체의 크기에 맞게 disk에 공간을 차지한다는 개념이였다. 물론 Lucene도 마찬가지로 이 부분에 대해서 고려한 부분이 있었다. 이 코드를 이해하고 ‘아~!’ 하고 머리를 쳤으니 참 기쁘기 한량없었다. […]

계속 읽기