일주일전에 zdnet에서 본 글이다.
게이츠 회장이 미래사회 검색의 중요성에 대해서 아주 정곡을 찌르는 발언을 했다.
게이츠는 미래에 대해 언급하며 “지금은 뭔가 검색하면, 그러니까 약 11분쯤 걸리는 보물찾기를 하듯 링크만 잔뜩 던져준다. 미래에는 검색에서 실제로 답을 줄 때 필수 불가결한 요소인 문서 이해 기술을 보유할 수 있을 것”이라고 덧붙였다.
작은 모바일 기기에서 많은 검색결과는 장애물일 뿐이다.
단 한가지 자신이 필요로하는 검색만 필요할 뿐이다.
그 작은 화면에서 스크롤하면서 볼려면 대단한 인내심이 아니고는 하기 힘든 일이기 때문이다.
내가 원하는 정보에 바로 도달할수 있는 한개의 링크만이 필요하다는 이야기이다.
이런걸 하기 위해서 무엇이 필요한지 게이츠 회장은 정확히 짚어줬다.
바로 문서에서 주제를 추출하는 기술이 필요하다는 이야기이다.
이 문서에서 대체 무엇을 말하려고 하는가만 알수 있다면 검색어를 이용해 정확히 짚어낼수 있다는 이야기이다.
글을 보면 이미 MS에서는 기술개발을 하고 있는것으로 보이는데, 아마도 영어에만 국한된 기술이 되지 않을까 한다.
한국어의 특성이라는 벽이 그리 낮지만은 않다는걸 많은 외국 검색업체들이 이미 알고 있는 사실이기 때문이다.
유독 한국에서만이 외국 검색업체들이 명함도 못내밀고 있다는 사실이 그걸 반증한다.
지금 내가 하고있는 형태소 분석기 제작 작업이 그와 전혀 무관하지 않다.
요약정보 생성및 문서 유사도 비교 주제어의 추출의 기본은 바로 한국어 형태소 분석이 자리잡고 있기 때문이다.
정보검색이라는거 그리 섣불리 정복할수 없는 분야임에 분명하다.
남들이 다 할수 있는 98%보다 나머지 2%를 정복하기가 힘든분야이니….
MS 회장 빌 게이츠「검색기술, 더 발전해야」 by from __future__ import dream is licensed under a Creative Commons Attribution-NonCommercial 4.0 International License.