Algorithms of the Intelligent Web

주문했던 Algorithms of the Intelligent Web 책이 도착했다.한 2주 걸렸나 모르겠다. 쩝 .. 점심 시간에 쭉 보고 있었는데,… 책의 예제 설명들이 괜찮은거 같다는 느낌이 든다. 게다가 이 책의 내용중에 여러 분류기를 조합해서 만드는 bootstrap bagging 을 실제 이용한 예제는 다른 책에서 보기 힘든 예제임에 확실하고…(분류기 조합의 성능은 이미 Netflix 콘테스트에서 증명이 되었으니..)게다가 다른 여타 개론 […]

계속 읽기

밀린 개인 업무를 처리하기 위해 휴가를…

급기야 개인 업무를 처리하기 위해 책 몇권을 들고 도서관을 찾았다. 주로 집 근처의 금천 구립 도서관을 찾는데, 오늘 휴관일이라 고대 도서관에 왔다. 시험기간이긴 해서 자리를 잡는게 힘들어 매뚜기를 뛰고 있기는 하다. 예전에는 랜 케이블을 꽂으면 바로 인터넷이 되었는데, 이제는 로그인까지 하라고 한다. 허허 그래서 졸업을 했지만 예전 포털 아이디를 넣으니 잘 된다. ㅋ 오전중에 번역 […]

계속 읽기

EM 클러스터링 알고리즘 코드

정확한 코드는 이곳에서 제공하고 있습니다. —————————————————–얼마만의 코드 관련 포스팅인지 모르겠다. 휴우~~~  어제 boost/math 라이브러리에 확률관련 모듈이 있는걸 보다가 문득 생각이 들어 EM 클러스터링 알고리즘을 구현해 봤다. EM 알고리즘은 k-means알고리즘과 접근 방식이 100% 동일하나 단 확률과 통계 관련 지식이 조금 필요하다. 특히나 likelihood 관련 개념 이해는 구현을 위해 필수적이다. 이 알고리즘의 구동 과정은 아래와 같다. 1. […]

계속 읽기

Expert?

어느날인가 홍콩 개발자하고 업무 관련 논의를 하다가 아이폰 개발을 하는 것에 서로 관심이 있어서 이것 저것 이야기 할 기회를 얻었다. 아이폰 개발을 하려면 여러가지 배워야 할 것들이 있는데 아직 시간을 내가 힘든 상황이다. 라고 이야기 하니 “이미 너는 C++ Expert니까 Object-C정도는 크게 어렵지 않게 할 수 있을거다” 뭐 이런 내용의 이야기를 하더라… C++을 잘 한다…켘~~~ […]

계속 읽기

Weka관련 연재 예정 – 월간 마소 7,8,9월

월간 마이크로소프트웨어의 7,8,9월 연재로 Weka에 대해서 하기로 계획을 올해 초 잡았던 적이 있었는데, 실제 그렇게 집필을 하게 될 듯 하다. 사실 요 집필 계획은 번역하고 있는 collective intelligence in action의 add-on 성격으로 집필 계획을 잡았으나 아직 이책이 현재 퇴고 과정인 관계로, 연재가 더 빠르게 세상이 나오게 될 듯 하다. 3회 연재는 처음인데, 이런 집필 계획을 […]

계속 읽기

내가 현재 생각하는 최고의 C++책은?

금번 C++프로젝트를 하면서 집에 이렇게 내가 많은 C++책을 가지고 있었나 할 정도로 다시 한번 놀랐다. 뭐 그저 그동안은 공부하기 위한 C++이였다. 그리고 밥 먹고 살기위한 C++은 아니였으니 말이다. 내가 최근에 이렇게 C++ 노래를 부르는 이유는 따로 있다. 언어를 언어답게 쓰는 프로젝트를 처음 만났기 때문이다. 그래서 C++을 처음부터 끝까지 다시 리뷰를 하는게 필요했다. 사실 리뷰라고는 하지만 […]

계속 읽기

글로벌 프로젝트를 하면서 느끼는 점 몇 가지

3개국의 개발자들이 모여서 개발을 함께하는 프로젝트를 참여하고 있는데 이에 대해서 느끼고 있는 점 몇 가지를 올려본다.한국에서 한국 개발자들과 일하는 것과는 사뭇 많이 다르다. 1. 개발을 하는 전체 작업중에 코드 리딩이 50% 정도 되는 듯 하다. svn update를 하면 전날 코드의 업데이트가 줄줄 되는 것을 볼 수 있다. 이들 코드를 살펴보고 어떤 점이 내 모듈에 영향을 […]

계속 읽기

통계 알바 재밋네..

이런 저런 관심 때문에 틈틈히 배워둔 확률/통계학 덕분에 요즘 용돈 보충을 좀 하고 있다. 이런 논문 통계작업이 내가 생각했던 것보다 상당히 높은 알바비가 책정되어 있다는게 사실 약간 납득이 가지 않지만 덕분에 쏠쏠한 재미를 보고 있긴 하다. 집에서 약 3시간 정도 잡고, 고민하고 책도 좀 뒤적이면서 관련 방법론을 리마인드 한 다음에 회사 점심시간을 짬내서 이틀정도 작업하니 […]

계속 읽기

R언어를 경험하다.

최근 R언어를 사용해 논문 통계 데이터를 핸들링 하고 있다. 사실 익숙해 지니 여타 다른 엑셀과 같은 툴이 부럽지 않은 장점이 있다. SAS, SPSS는 비싸고 그렇다고 해적판을 깔아서 쓰기도 좀 그런 단점이 있다. 그렇다고 엑셀을 사용하자니 데이터의 통계를 내기 위한 단순한 함수 적용을 함으로써 약간 답답한 면이 있고, 그렇게 많지 않은 함수만을 제공하고 있어서 사용하기 좀 […]

계속 읽기

한글 처리 관련 프로젝트

최근들어 새로운 프로젝트로인해 한글 처리를 주로 하는 작업을 하고 있다. 물론 지난달까지 다른 일에 매달리느라 정신 없었는데… 이제 숨좀 돌리면서 코드에 집중을 하고 있다. 역시나 서비스 관련 프로젝트가 정말 많은 리소스를 소요하는 것이라는 것을 새삼 다시 깨닫게 되었다. 요즘엔 본사 개발자와 직접적으로 일을 하고 있는데, 새로운 개발 환경과 업무 방식 그리고 코딩 룰 같은 것을 […]

계속 읽기