검색엔진

고감자 on 7월 12th, 2010

구글 음성검색, 다음 음성검색 최근 동생 휴대폰으로 구글 음성검색만 살짝 써봤는데,  역시 핸드폰에서 음성검색의 잠재성을 확인하기 충분한 경험이였다. 몇몇 발음에 대해서는 단어 인식이 확실히 되지 않는것도 확인했는데, 점점 검색을 사용하는 사람들이 늘어나면 늘어날 수록 퍼포먼스는 좋아질 수 밖에 없을 거라는 생각을 해봤다. 사실 음성검색도 로그로 충분히 성능 향상을 할 수 있는 분야이기도 하다. 모르겠다.. 이부분에서 [...]

Continue reading about 모바일 음성검색

고감자 on 6월 12th, 2010

전혀 기대하고 있지 않았는데, 3월달에 이 책의 번역서가 나왔다는 것을 오늘 알았다. 그래서 바로 주문하고 몇 챕터 확인 후 포스팅을 써본다. 야후 웹검색, YST라고 불리우는 기술이 현재로서는 MS로 대부분 넘어간 상태지만 그 전에 이 책이 나오게 된것을 상당히 다행스럽게 생각하고 있다. 알고 있는 분들이 이미 있겠지만 이 책의 공저자중에 한 분이 야후 리서치를 책임지고 있는 [...]

Continue reading about introduction to information retrieval 번역서

요 데이터마이닝 관련 프로젝트는 많은 소프트웨어 개발자들이 느끼는 개발자 자신의 겸손한 자세를 요구하는것과 더불어 인간 지적판단의 위대함을 다시한번 느끼게 해주는 몇 안되는 프로젝트이다. 많은 소프트웨어의 버그 해결 과정은 깊은 자기 반성의 시간이 된다. 자신에 대한 확신이 강한 사람은 심지어 컴파일러까지도 의심하지만 대부분의 경우 본인에게 문제가 있다. 이런 과정이 반복되고 경험이 쌓이면 개발자 자신이 자신에 대해서 [...]

Continue reading about 흉내내기 힘든 인간 지적판단과 지능형 소프트웨어

고감자 on 5월 28th, 2010

과학(science)와 기예(art)… 뭐 일단 이렇게 영어로 표현해 볼 수 있겠다. 국어 사전을 보니 기예가 “기술에 대한 재주”라고 표현되어 있는데, 내가 의도한 의미와 일맥상통한다. 개인적으로 데이터 마이닝이라는 단어를 좋아한다. 이 처럼 이 학문 영역을 잘 성명할 수 있는 이름은 없기 때문이다. 과정 자체가 금맥을 찾는 과정과 흡사하다. 많은 데이터 마이너들이 알고리즘으로부터 시작을 한다. 하긴 거의 모든 [...]

Continue reading about 데이터 마이닝은 과학과 기예의 결합작

Data Mining, Third Edition: Practical Machine Learning Tools and Techniques (The Morgan Kaufmann Series in Data Management Systems) 2판은 현재 내 책상 위에도 있을 정도로 즐겁게 참고하는 책이 되어 버렸다. 2판이 나온지 5년이 되가고 있고 3판 언제 나올까? 하고 찾아보고 있었는데 2011년 초 출간 예정이다. 역시 최신 트렌드를 다루고 있다.대용량 데이터 셋 처리, 앙상블 러닝, [...]

Continue reading about Data Mining, Third Edition: Practical Machine Learning Tools and Techniques