요즘 ‘개체명 인식’관련 논문을 읽고 있는데, 딱 내가 찾는 논문 주제라는 생각이 든다.
업무적으로도 궁합이 맞고, 게다가 1학기때 배운 ‘Machine Learning’이나 ‘Pattern Classification’을 아주 시기 적절하게 공부를 한 상태여서 아주 기분좋게 논문을 읽고 있는 중이다. (conv2님 Ernie님 감사합니다. 역시나 주변분들이 내가 진정 무엇을 원하는지 잘 아시는거 같다.)
지금 “2단계 최대 엔트로피 모델을 이용한 한국어 개체명 인식“이라는 연세대학교 석사논문을 읽고 있는데, 기존에 나온 논문 정리도 잘 해주고 개체명 인식을 대부분을 어떻게 하고 있다는 것까지 아주 상세하게 설명을 하고 있어서 아주 흥미롭게 읽고 있다.
읽으면서 느끼는건, 일단 지금 만들고 있는 형태소 분석기에 품사 테깅을 해야될거 같다는 생각이 들고,(이전에는 그저 용언인지, 체언인지 독립언 인지만 테깅했다. 일단 귀찮아서..) 기존의 논문을 읽어보고 여러 방법론의 문제점을 확실이 인지한 다음에, 새로운 방법론으로 보완해 나가는 방법을 써야할거 같다. 일단 두가지 논문을 참고하고 있다.
나머지 한가지 논문은 학교 도서관을 통해 논문복사 신청을 해놓은 상태다.
신경망과 규칙을 이용한 한국어 개체명 인식 시스템의 구현
에궁… 그리고 대학원 영어시험 준비도 해야는데, 일단 미뤄놓고 있는 상태.
개체명 인식으로 논문 방향잡았음 by from __future__ import dream is licensed under a Creative Commons Attribution-NonCommercial 4.0 International License.