야후!의 검색어 오타 교정 시스템

아래 글은 이번 “야후! 검색어 오타 교정 시스템“을 론치 하면서 일반 사용자들이 이해하기 편한 소개글을 써달라고 해서 써본 글이다.

이 글을 쓸 당시 “글로리아 스튜어트”의 타개 뉴스가 올라왔고, 그분의 이름이 인기쿼리로 올라온게 눈에 띄어서 이를 소재로 삼아 봤다.

야후! 블로그 담당자분이 글을 보기 좋게 편집/수정해 주셔서, 더욱 빛나는거 같다.

——————————————————————————————————————————

 

“글로리아 스튜어드?”

얼마전 향년 100세의 일기로 별세한 타이타닉의 할머니 배우를 기억하실 겁니다. 여주인공의 노년 시절 연기를 상당히 인상적으로 했던 분인데, 아쉽게도 타계를 하셨네요.

영화 타이타닉의 감동을 다시 느껴보고 싶다는 생각이 들면서갑자기 이분의 일대기가 궁금해 지기 시작해집니다.




당시 영화에 출연한 “케인트 윈슬랫”이라는 여배우도 생각이 나는군요. 게다가 지금은 너무도 유명배우가 된 “레오나르도 디카프리오”도 검색해보고 싶은 욕구가 마구마구 생깁니다.



검색을 하려면 정확한 검색어의 입력이 중요합니다. 그러나 키보드 배열의 문제 그리고 외래어 음차표기의 문제 때문에 한글  오타가 생각보다 상당히 많이 발생합니다. 앞에 나온 “글로리아 스튜어드”의 경우도 사실 우리가 하기 쉬운 오타의 한가지 경우입니다. 정확한 검색을 위해서는 “글로리아 스튜어트”로 입력을 해야 합니다.“케인트 윈슬랫”의 경우도 사실 정확한 검색어는 “케이트 윈슬렛”이죠. 특히나 “윈슬랫”의 경우 “윈슬렛”하고 무척이나 헷갈립니다.

“레오나르도 디카프리오”의 경우 많은 분들이 잘 입력 합니다만, “레”를 “래”로 입력하는 분들이 아직도 있긴 합니다.

이런 한글의 특징 그리고 범람하는 외래어들의 한글표기 문제 그리고 고질적인 두벌식 키보드의 문제로 인해 검색과 오타 쿼리는 뗄레야 뗄 수 없는 관계가 되어 버렸습니다.

그래서 이를 해결하기 위해!!야후!에서 쿼리 오타 교정 시스템을 대대적으로 구축하게 되었습니다.

어떻게 교정해주는지 한번 확인해 보실까요?

 

예1) 글로리아 스튜어드로 검색했을 경우


평소에 많은 검색이 이루어 지지 않는 검색어 임에도 불구하고 정확하게 “글로리아 스튜어트”를 추천 해주고 있습니다.

 

 

예2) 케인트 윈슬랫으로 검색했을 경우

“케인트 윈슬랫”의 경우도 “케이트 윈슬렛”으로 정확한 추천을 해줬군요!

호기심 많은 사용자 분들은 “케인트”와 “윈슬랫” 두 단어를 각각 따로 검색어 입력을 하실지도 모르겠네요. 하지만 아쉽게도 “케인트”는 별도로 존재할 때 “케이트”로 추천되지 않습니다. 역시 “윈슬랫”도 마찬가지 입니다. 이는 두 단어가 함께 검색어로 입력할 경우에만 추천이 되게끔 사용자의 로그를 분석해서 추천 점수를 산정하기 때문입니다.



“에고… 이런거 N사나 D사에서도 다 되는거 아냐?” 꼭 다른 검색 서비스에서도 이 검색어나 다른 검색어를 사용하여 오타 교정이 잘 이루어지는지 확인 해보시기를 바랍니다. 몇 번만 해보시면 야후!의 검색어 오타 교정 시스템이 그 만큼의 가치가 있다는 것을 느끼 실 수 있으실 것입니다.


CC BY-NC 4.0 야후!의 검색어 오타 교정 시스템 by from __future__ import dream is licensed under a Creative Commons Attribution-NonCommercial 4.0 International License.