요즘 기술적인 부분보다 그냥 생각하는 것들을 블로그에 많이 적고 있다.
형태소 분석이든 검색 모델이든간에… 고전적인 Text 기반의 검색을 이야기 하고 있다.
물론 Text는 검색을 위해서 중간의 인터페이스가 될 수 있다. 인터페이스가 된다 함은 Text가 다루기 쉽고, 현재 정보검색에서 연구분야도 많은 뿐더러 실례로 상당히 많이 때문이다.
얼마전에 동영상 검색을 하는데 음성인식 기술을 이용해서 Text를 추출후 그 Text를 기반으로 검색을 하는 검색엔진이 등장한적이 있다.
몇가지 현존하는 기술을 접목함으로서 동영상 검색에 한발 다가서게 된 것이다. 동영상 검색이 거창하게 시작되는게 절대 아니라는 것을 보여주는 대목이다. 앞으로 이미지 분석이 영상 검색의 키로 작용이 되겠지만 이 부분은 더 어려운 부분이니.. conv2님에게 맡기도록 하고.
어제 Machine Learning을 배우는데 위와 같은 내용의 프로젝트를 제안을 해보고 어떤지 반응을 살폈는데 교수님이 별 반응이 없으시다. ㅜㅜ
HMM을 다시 공부하고 음성신호처리 전문 교수님에게 뭔가 배우고 나면 음성 소스에 대한 이해를 좀 더 상세하게 할수 있으리라 본다.
그래서 이번 학기 텀 프로젝트는 Speech to Text를 조금이나마 감을 잡아보는걸로 하도록 해야겠다. 얻을수 있다면 지금 국내 기술 수준이 어느정도인지 살짝 엿보는것도 좋은 경험이 되리라 생각이 든다.
거두 절미 하고!
검색의 소스가 되는것들을 이해라려고 노력하는것을 절대 게을리 하면 안될 부분같다.
하지만 text mining, image mining, web mining, video mining 등등 뭔놈의 마이닝 대상이 되는것들이 이리 많은지, 언제 끝이야? ㅜㅜ
검색의 소스가 되는 대상에 대한 이해 by from __future__ import dream is licensed under a Creative Commons Attribution-NonCommercial 4.0 International License.