3일동안 회사 메일을 들여다 보지 않다가 지금 들여다 보고 너무 기분 좋은 메일을 받아서 어쩔줄 모르며 메일 쓴다. 지난 4개월동안 한가지 프로젝트에 매달려서 많은 경험을 했다는 사실은 이미 블로그에 이야기 한지 오래다. 전혀 새로운 개발 환경과 프로세스에 매달리며 동시에 성과도 내야 하는 그런 프로젝트를 하면서 같이 일하는 분들에게 누가 되지 않도록 정말 많은 노력을 하고 [...]
“너 블로그 접었냐?” (typos님의 메신저 질문) “블로그 잘 보고 있습니다. 요즘 블로깅이 뜸한거 보니 좀 바쁜가 보네요?”(받은 메일 중에서) “좋은일 있냐?” (블로깅보더 더 재미있는일 있냐?) 뭐 등등 요즘 가장 많이 받는 질문중에 하나이다. 위와같은 생존과 근황을 궁금해 하는 사람들이 많아서 그런지 최근 블로깅을 하나도 안함에도 불구하고 구독자는 꾸준히 증가하고 있는 기이한 현상까지 경험하고 있다. ㅋ [...]
Collective Intelligence In Action 을 번역하기 위헤 통독을 마쳤다. 일단 한명의 독자로서 소감을 말해보자면 Programming Collective Intelligence 과 함께 Machine Learning을 서비스의 관점에 따라 실용화 하고자 하는 노력이 담긴 책이라고 말하고 싶다. 일단 Programming Collective Intelligence가 짧고 강력한 Python 언어로 다양한 예제를 매우 효과적으로 표현했다면, CI in Action같은 경우는 다양한 알고리즘을 보여주기 보다는 키가 되는 [...]
Continue reading about Collective Intelligence In Action 통독 소감
요즘 weka와 JDM 같은 데이터 마이닝 자바 패키지에 관심을 보이고 있는데, 실제 자바로 데이터 처리를 하고 요런 라이브러리에 넣을 라고 하니 영 불편하게 아니다. 원래 이런 것을 돌릴때는 데이터에 이런 저런 추가적인 작업을 많이 해준다. scaling은 기본이고 몇가지 필드를 추가해보고 돌려보고, 빼고 돌려보는 과정을 수도없이 반복해보는 과정이다. 물론 이런 과정은 경험에 따라서 단축이 될수 있는 [...]
2003년인가 누군가가 spam filter에서 compression ratio가 중요한 펙터로 작용한다는 글을 쓴적이 있었다. 이는 스팸문서의 경우 단순한 패턴의 연속표현일 경우가 있다는 가정이 깔려 있다. 그런 문자열의 반복성은 압축 알고리즘의 구현 원리에 따라서 압축률을 측정함으로 간접적으로 측정이 가능할 것이다. 물론 지금 이 feature를 spam 필터링에 쓴다는 이야기는 절대 아니고 다른 작업을 하고 있는데 이 compression ratio가 중요한 [...]