데이터를 한눈에 볼 수 있는 방법을 찾다가 결국 Excel로 넘어가고, 좀더 내가 하고자 하는 일에 맞는 결과를 빨리 보기 위해 weka로 넘어갔다. 그러다 이놈이 메모리 문제, 불안정성 등을 이유로 요즘엔 matlab으로 넘어가려고 한다.
실제 matlab은 야후 전사적으로 research 그룹에서 빈번하게 사용하는 툴이라서 매킨토시, Windows, Linux 등 여러 플랫폼의 바이너리가 사내에서 직원에게 제공이 되고 있었다. 사실 이 정보도 회사분을 통해서 알게 되었다. ^^;
그나저나 요 한달동안 weka를 상당히 유용하게 사용을 했다.
물론 수많은 데이터를 보기 위해 어쩔수 없지 샘플링을 해서 봐야 했지만 요놈이 비주얼 하게 보여주는 기능은 이전에 직접 그래프를 그리던 노가다를 상당부분 해소해 줬다.
사실 데이터 작업을 하기 위해서 여러 전처리 작업을 해야 하지만 이 툴은 그저 결과를 가능한한 많은 축을 이용해서 보여준다.
참 좋은 툴이다.
실제 weka에서 많은 알고리즘이 추가되어 있지만 이것만큼 많이 쓰는 기능은 실제 없다.
실제 툴을 사용하는것에 대해서 부정적인 입장을 가지고 있었던게 사실이다. 개발자들이 뭐 다 그렇듯이 손맛을 느끼면서 코딩하면서 해야 제맛인지라 그 피를 못속이는거 같다.
하지만 그 작업들이 단순 반복적인 작업이라면 툴이나 라이브러리를 사용하는것도 괜찮은것 같다.
하긴 내가 굳이 구현을 해보려는 이유중에 하나는 블로그를 쓰는 이유하고 비슷하다.
내가 과연 이해하고 있는지 확인하는 측면이 강하다는것이다.
하지만 이제 데이터 분석이 이제 좀 이해가 되려 하니 툴을 쓸 차례가 된듯 하다.
더 재미난 작업에 집중하는 시간을 늘이기 위해 툴을 쓰는것도 나쁘지 않을듯 하다.
좋은 툴도 좀 사용할 줄 알아야 겠다. by from __future__ import dream is licensed under a Creative Commons Attribution-NonCommercial 4.0 International License.