2달에 걸친 노력을 쏟은 논문 실험에 일단 실패 했다. 첫술에 배부르랴마는 실망이 말이 아니군…
이틀동안 아무것도 안하고 그동안 읽지도 않고 밀어 뒀던 책만 보다가 실험을 뒤로 하고 논문 집필 작업에 들어갔다. 실험이 끝나기 전엔 집필을 하려고 하지 않았는데 교수님을 금요일날 만난 자리에서 논문실험하고 집필하고 같이 해나가는게 좋을꺼라는 말씀을 듣고 바로 오늘부터 집필에 들어갔다. 실험이 끝나고 나서 쓸 이야기가 생각이 안날수도 있다는 말씀을 하셨다. 맞다….. 블로그 글도 바로 감이 왔을때 쓰는게 정말 잘 써지니 틀린말씀은 아닌거 같다.
일단 집필 작업을 조금 해보니 뭔가 정리가 되어가는거 같다. 글로 표현하면서 그동안 봤던 자료들 정리하고 하면서 그 자료들에 대해서 정확하게 이해를 하게되는거 같고 처음하고는 다르게 논문의 방향과 목적도 확연해 지는 느낌이 들었다.
오늘 학습 파라메터에 대한 조정을 조금씩 해가면서 학습을 시켜 보는데 점점 정확도는 실험을 해가면서 높아지기는 한다. 다행이다.
악~~ 근데… 방금 발견한 중요한 사실이 있다. 내가 레퍼런스 하고 정확도에 대한 갱신을 하고픈 논문이 있는데 그곳에서 제공하는 corpus 테스트 데이터에 에러가 있는걸 확인했다. spam 하고 ham하고 판정 데이터를 거꾸로 해놓은 부분이 있었던 것이다. 어째 이럴수가 있는거지? www 컨퍼런스면 유명한 컨퍼런스인데 점점 논문에 의심이 가기 시작하는군…쩝
아무튼 test 데이터에 오류가 있다는걸 발견했으니 테스트 데이터 결과의 정확도가 떨어지는 post, comment 쌍에 대해서 오류가 있나 없나 샘플링 리뷰를 거쳐야 할거 같다.
이 사람이 제공하는 논문 데이터 때문에 test 데이터 걱정은 안했는데 결국은 검증이 필요한거군. ㅜㅜ
논문 실험에 실패하고…. by from __future__ import dream is licensed under a Creative Commons Attribution-NonCommercial 4.0 International License.