야후!의 검색어 오타 교정 시스템

아래 글은 이번 “야후! 검색어 오타 교정 시스템“을 론치 하면서 일반 사용자들이 이해하기 편한 소개글을 써달라고 해서 써본 글이다. 이 글을 쓸 당시 “글로리아 스튜어트”의 타개 뉴스가 올라왔고, 그분의 이름이 인기쿼리로 올라온게 눈에 띄어서 이를 소재로 삼아 봤다. 야후! 블로그 담당자분이 글을 보기 좋게 편집/수정해 주셔서, 더욱 빛나는거 같다. ——————————————————————————————————————————   “글로리아 스튜어드?” 얼마전 향년 100세의 일기로 […]

계속 읽기

번역서 1차 프린트물

이렇게 편집된 번역서 프린트물을 보다니.. 감회가 정말 새롭다. <클릭하면 큰 화면으로 볼 수 있다.> 10월 말이면 번역 이외에도 많은 일들이 마무리 될거 같은 예감이 든다.  이런 저런 새로운 소식도 있을 것이고 아마도 올해중에 가장 중요한 달이 될듯 한 예감이 든다. 여튼 2주안에 최대한 독자의 마음으로 번역물을 최종 점검하고 출판사로 넘겨야 되겠다. ps. 마지막 페이지가 526페이지인데… 생각보다 […]

계속 읽기

한글날 논문 구두 발표 확정

돌아오는 22회 한글 및 한국어 정보처리 학술대회에서 논문 구두발표로 심사 결과를 통보 받았다. 제목은 “한글 쿼리 오타 패턴 분석과 사용자 로그를 이용한 한글 쿼리 오타 교정 시스템 구축” 2년전에 포스터 발표를 했었는데, 구두발표는 처음이군… 여튼 추석 연휴에 발표자료 만들고 논문 최종 손질을 해야 될듯 하다. 개인적으로 한글 연구자분들도 좋지만 실제 서비스 가능한 지능형 애플리케이션을 개발하는데 관심이 […]

계속 읽기

검색어 오타에 대한 흥미롭고 재미있는 사실들

아래는 전에 YDN KR blog에 기고했던 나의 글이다. 사이트가 거의 관리가 안되고 있는 관계로 언제 없어질까 살짝 염려스럽기도 했서 퍼오게 되었다. ————————————————————————————————- 검색 엔지니어로서 사용자 검색어 로그를 분석하다 보면, 상당히 재미있고 흥미로운 사실들을 발견 할 수 있습니다. 이런 데이터를 기반으로 세상을 보게 되기 시작하면, 사용자들이 개개인의 고유 특징이 있을거라 생각하지만 조그만 검색박스 내부로 그 공간을 […]

계속 읽기

회사 프로젝트를 기반으로 논문 쓰기

서론, 선행연구는 미리 써놓고 본문과 결론은 이틀만에  부리나케 작성했다. 그나마 논문이 잘 나와준거 같아서 기분은 좋다. 회사 리뷰 소감을 한마디로 쓰자면 ‘발표를 위해 회사에서 밟아야 될 프로세스가 생각보다 많다.’ 정도이다. 게다가 야후! 본사에서는 많은 논문이 나오고 있는 반면, 금번 야후!코리아에서는 내가 처음이라고 하더라.. 그 때문에 이 프로세스를 확인하는데 좀 번거로웠던거 같다. 더욱이 한글 논문이여서 리뷰해줄 […]

계속 읽기

흥미로울것 같은 분야… 게임 마이닝..

이래저래 요즘 앞으로 장래의 계획에 대해서 생각해보고 있다. 앞으로의 경력을 어떻게  만들어 나갈 것인가?  흥미로운 분야는 없을까? 등등…. 그러다.. 이런 저런 기회를 통해 “생물정보학”과 같은 내가 지금까지 해오던 것들과 도메인 자체가 다른 것들에 대해서 주변에 지인들을 통해 많은 정보를 얻고 있다. 이런 분들이 주변에 있다는 것은 참으로 고마운 일이 아닐 수 없다. 지금껏 해온 일들이 […]

계속 읽기

R언어 GUI 환경 R commander

R을 써본 사람은 아시겠지만 R은 거의 shell환경에서 커멘드라인을 통해 작업을 할 수 밖에 없는 기본 환경을 제공하는데 그런 사용상 사용자에 친숙하지 않은 환경을 보완하기 위해 R commander가 나오게 되었다. 물론 R commander 역시 R을 처음 접할때부터 사용하면 이 역시 만족할만한 환경이 아님을 알 수 있으나,  처음부터 R 커멘드라인을 사용해온 사람이라면 이정도의 환경이라도 얼마나 편한지 잘 […]

계속 읽기

뉴머러티(The Numerati)

뉴머러티.. 흥미롭게 읽은 책이나… 전에 읽었던 슈퍼크런처보다는 약간 주변을 맴도는 듯한 느낌이 드는 책이다. 역시 같은 소재이지만 교수가 쓴 책하고 디테일의 차이가 있는거 같다. 책 두께는 얇은데 종이 재질이 얇고 글자 줄 간격이 빼곡해 넘기는 재미는 없는 책이다. 하지만 그동안 번역서가 나오길 기대한 책이고 몇 안되는 데이터 마이닝 활용 수기(?) 책중에 하나라서 즐겁게 머리 식힐겸 […]

계속 읽기

Regression test failure.

오늘 드디어 커밋을 하고 말거라는 각오를 하고 출근했다. 코드 리뷰 시작한 다음날  ship! 메시지를 받았으나 코드 커밋 직전에 Regression test fail을 보고 나서 애매한 클래스 구조를 다시 설계하고 좀더 세밀한 테스트를 하게 되었다. 이 와중에 다른 사람들이 만들어 놓은 코드들에 대해서 상당히 많은 부분을 이해하게 되는 계기가 된듯 하다. 코드 커밋 전에 반드시 확인해야 될 […]

계속 읽기

프로그래머의 길, 멘토에게 묻다 – 리뷰

인사이트에서 신간이 나와 오늘 다시 책을 한권 받았다. 이전 책은 다 읽지도 못했는데, 이번책은 살펴본지 20분만에 리뷰를 쓰게 되었다. ^^; 이 목차만으로도 책을 열어보고 싶은 욕구들이 마구마구 일어나고, 실제 열어보면 그리 부담없이 읽을 수 있는 내용들이여서 너무 좋다. 제일 처음 열어본 목차가 무엇인지는 내가 지금 어떤 개발과정을 겪고 있는지를 쉽게 짐작이 가능하게 한다. 지금 하고 […]

계속 읽기