네이버의 Query 마이닝
컨텐츠검색 스토리(2) – 컨텐츠검색은 어떻게 만들어질까 라는 글을 보다가 쿼리 자동완성에 마이닝 기술과 클러스터링 기술이 들어 갔다고 해서 생각 좀 해봤다. 문제의 그림…. 요걸 보니까.. 딱 생각나는 방법이 있다. 쿼리의 유형을 빠르게 분석하기 위해서는 형태소 분석의 방법을 쓰는게 좋을까?개인적으로는 n-gram방법이 효율적이라고 생각한다. 특히나 다국어나 인터넷 신조어 처리를 해야 한다면 말이다.위의 결과를 보자면 “꽃보다남자”라는게 클러스터링 되어서 […]
계속 읽기