확률모델

패턴인식과 기계학습 공부한 덕을 톡톡히 보는구나.

오늘 정보검색론 책도 없고 그래서 인터넷으로 ‘확률모델’문서를 보고 있는데, 이거 왠걸…
확률모델 별거 아니더라.

전에 베이지언(Bayesian) 룰을 공부하면서 관심이 있었던, 스팸처리 알고리즘과 거의 흡사했다.
하긴 생각해보니 스팸이 아닌 글과 스팸인 글을 분류하는거 자체가 쿼리에 맞는 문서집합과 퀘리에 맞지않는 문서집합을 분류하는거와 마찬가지더라는…

게다가 색인어 각각이 서로의 색인어의 존재에 별 영향을 끼치지 않는다는 가정까지 해서 나이브 베이시언(Naive Bayesian)룰을 사용해 풀어가는 모습이 전에 기계학습을 배울때 공부했던 것들이더군.

역시나 검색은 확률을 빼놓고는 상상을 할수 없는 분야인거 같다.
Probability VS Possibility

CC BY-NC 4.0 확률모델 by from __future__ import dream is licensed under a Creative Commons Attribution-NonCommercial 4.0 International License.