모바일 음성검색

구글 음성검색, 다음 음성검색

최근 동생 휴대폰으로 구글 음성검색만 살짝 써봤는데,  역시 핸드폰에서 음성검색의 잠재성을 확인하기 충분한 경험이였다.

몇몇 발음에 대해서는 단어 인식이 확실히 되지 않는것도 확인했는데, 점점 검색을 사용하는 사람들이 늘어나면 늘어날 수록 퍼포먼스는 좋아질 수 밖에 없을 거라는 생각을 해봤다.

사실 음성검색도 로그로 충분히 성능 향상을 할 수 있는 분야이기도 하다.

모르겠다.. 이부분에서 음성로그를 이용한 검색어 인식 성능향상에 대한 논문이 있는지 없는지.. 하지만 구글은 이미 하고 있을거 같기도 하고…

간단히 Query reformulation이라고 하는 개념을 음성검색에도 사용하는 것도 한 방법이 된다.

마찬가지로 특정 세션내에서 수초 내에 도착한 유사한 음성검색로그 pair를 이용하면 된다.

예를 들어 이런 경우다. “다음”을 “더음”이라고 삐꾸나서 검색 했을 경우 사용자는 “다음”을 의도했기 때문에 다시 “다음”음성 검색을 시도하게 될 것이다. 이런 경우 두 음성 쿼리는 짧은 세션내에서 공존하고 있을 것이다.  이들 pair를 수집해 학습에 사용하는 것이다. 이 정보는 아주 유사한 발음들에 대해서 정확히 구분하기 위한 좋은 정보가 될 것이다.

물론 이 경우 모든 reformulation을 사용해서는 안되고 적절하게 그 수준을 한정하는 것이 중요할 것이다(그래서 리서치가 필요한 것이다.)

그리고 음성검색에서 바로 검색 결과를 보여주기 보다는 명확하지 않은 발음에 대해서는 threshold를 두어 검색에서 제공하는 “이것을 원하셨습니까?” 와 같은 결과들을 보여주는 것도 사용성 증대를 위해서 필요한 것이 아닐까 한다. 왜냐면…. 한번 터치가 그래도 몇번의 모바일 타이핑 보다 더 덜 수고로울 것이기 때문이다.

물론 이 터치 결과도 학습에 사용될 수 있을 것이다.  따라서 이런 기능을 제공하는 두 가지 의미가 있다.

1. 사용자들의 편의성 증대.

2. 학습로그를 수집하기 위한 목적.


2를 하고 나서는 물론 같은 오류에 대한 것들에 대해서는 시스템에서 처리가 가능해야 할 것이다.

오타가 나기가 더 쉬운 모바일 검색에서 로그 활용이라든지, 개인화 특성을 고려한 검색 서비스가 더 필요해 질 것이라 보고 있다.


ps. 아..그런데, 정말 모바일 검색 쿼리들은 어떤게 들어올지 참 궁금하다. 그리고 오타 경향도 역시…

CC BY-NC 4.0 모바일 음성검색 by from __future__ import dream is licensed under a Creative Commons Attribution-NonCommercial 4.0 International License.