아파치 로그 구하기 힘들군…

이 블로그 서비스의 아파치 로그를 보내달라고 cafe24에 문의했으나 개인정보 관련 문제로 제공할 수 없다라는 답변만 받았다. 이 로그를 기반으로 외카 3회 연재때 아파치 로그와 외카를 활용한 웹 로봇 로그 분류기를 만들어볼 예정이였는데.. 일단 로그를 구할 수 없어서 마소에 3회 연재 주제 변경 요청을 해둘까 한다. 사실 imaso.co.kr 사이트의  웹 로그를 활용할 수 있는지 여부를 함께 […]

계속 읽기

Algorithms of the Intelligent Web

주문했던 Algorithms of the Intelligent Web 책이 도착했다.한 2주 걸렸나 모르겠다. 쩝 .. 점심 시간에 쭉 보고 있었는데,… 책의 예제 설명들이 괜찮은거 같다는 느낌이 든다. 게다가 이 책의 내용중에 여러 분류기를 조합해서 만드는 bootstrap bagging 을 실제 이용한 예제는 다른 책에서 보기 힘든 예제임에 확실하고…(분류기 조합의 성능은 이미 Netflix 콘테스트에서 증명이 되었으니..)게다가 다른 여타 개론 […]

계속 읽기

밀린 개인 업무를 처리하기 위해 휴가를…

급기야 개인 업무를 처리하기 위해 책 몇권을 들고 도서관을 찾았다. 주로 집 근처의 금천 구립 도서관을 찾는데, 오늘 휴관일이라 고대 도서관에 왔다. 시험기간이긴 해서 자리를 잡는게 힘들어 매뚜기를 뛰고 있기는 하다. 예전에는 랜 케이블을 꽂으면 바로 인터넷이 되었는데, 이제는 로그인까지 하라고 한다. 허허 그래서 졸업을 했지만 예전 포털 아이디를 넣으니 잘 된다. ㅋ 오전중에 번역 […]

계속 읽기

EM 클러스터링 알고리즘 코드

정확한 코드는 이곳에서 제공하고 있습니다. —————————————————–얼마만의 코드 관련 포스팅인지 모르겠다. 휴우~~~  어제 boost/math 라이브러리에 확률관련 모듈이 있는걸 보다가 문득 생각이 들어 EM 클러스터링 알고리즘을 구현해 봤다. EM 알고리즘은 k-means알고리즘과 접근 방식이 100% 동일하나 단 확률과 통계 관련 지식이 조금 필요하다. 특히나 likelihood 관련 개념 이해는 구현을 위해 필수적이다. 이 알고리즘의 구동 과정은 아래와 같다. 1. […]

계속 읽기

Expert?

어느날인가 홍콩 개발자하고 업무 관련 논의를 하다가 아이폰 개발을 하는 것에 서로 관심이 있어서 이것 저것 이야기 할 기회를 얻었다. 아이폰 개발을 하려면 여러가지 배워야 할 것들이 있는데 아직 시간을 내가 힘든 상황이다. 라고 이야기 하니 “이미 너는 C++ Expert니까 Object-C정도는 크게 어렵지 않게 할 수 있을거다” 뭐 이런 내용의 이야기를 하더라… C++을 잘 한다…켘~~~ […]

계속 읽기

Weka관련 연재 예정 – 월간 마소 7,8,9월

월간 마이크로소프트웨어의 7,8,9월 연재로 Weka에 대해서 하기로 계획을 올해 초 잡았던 적이 있었는데, 실제 그렇게 집필을 하게 될 듯 하다. 사실 요 집필 계획은 번역하고 있는 collective intelligence in action의 add-on 성격으로 집필 계획을 잡았으나 아직 이책이 현재 퇴고 과정인 관계로, 연재가 더 빠르게 세상이 나오게 될 듯 하다. 3회 연재는 처음인데, 이런 집필 계획을 […]

계속 읽기

내가 현재 생각하는 최고의 C++책은?

금번 C++프로젝트를 하면서 집에 이렇게 내가 많은 C++책을 가지고 있었나 할 정도로 다시 한번 놀랐다. 뭐 그저 그동안은 공부하기 위한 C++이였다. 그리고 밥 먹고 살기위한 C++은 아니였으니 말이다. 내가 최근에 이렇게 C++ 노래를 부르는 이유는 따로 있다. 언어를 언어답게 쓰는 프로젝트를 처음 만났기 때문이다. 그래서 C++을 처음부터 끝까지 다시 리뷰를 하는게 필요했다. 사실 리뷰라고는 하지만 […]

계속 읽기

글로벌 프로젝트를 하면서 느끼는 점 몇 가지

3개국의 개발자들이 모여서 개발을 함께하는 프로젝트를 참여하고 있는데 이에 대해서 느끼고 있는 점 몇 가지를 올려본다.한국에서 한국 개발자들과 일하는 것과는 사뭇 많이 다르다. 1. 개발을 하는 전체 작업중에 코드 리딩이 50% 정도 되는 듯 하다. svn update를 하면 전날 코드의 업데이트가 줄줄 되는 것을 볼 수 있다. 이들 코드를 살펴보고 어떤 점이 내 모듈에 영향을 […]

계속 읽기

통계 알바 재밋네..

이런 저런 관심 때문에 틈틈히 배워둔 확률/통계학 덕분에 요즘 용돈 보충을 좀 하고 있다. 이런 논문 통계작업이 내가 생각했던 것보다 상당히 높은 알바비가 책정되어 있다는게 사실 약간 납득이 가지 않지만 덕분에 쏠쏠한 재미를 보고 있긴 하다. 집에서 약 3시간 정도 잡고, 고민하고 책도 좀 뒤적이면서 관련 방법론을 리마인드 한 다음에 회사 점심시간을 짬내서 이틀정도 작업하니 […]

계속 읽기

R언어를 경험하다.

최근 R언어를 사용해 논문 통계 데이터를 핸들링 하고 있다. 사실 익숙해 지니 여타 다른 엑셀과 같은 툴이 부럽지 않은 장점이 있다. SAS, SPSS는 비싸고 그렇다고 해적판을 깔아서 쓰기도 좀 그런 단점이 있다. 그렇다고 엑셀을 사용하자니 데이터의 통계를 내기 위한 단순한 함수 적용을 함으로써 약간 답답한 면이 있고, 그렇게 많지 않은 함수만을 제공하고 있어서 사용하기 좀 […]

계속 읽기