고감자 – 페이지 36 – from __future_

데이터 마이닝의 재미와 그 의미를 이야기 하는 책

작성일자 2009년 07월 09일 고감자님이 작성

얼마전에 슈퍼 크런처(super cruncher) 책에 대한 서평을 블로그에 올린적이 있었다. 그 때에는 읽기 전이였고,,, 지금은 다른 관련 책들을 서둘러 찾아 읽고 있는 중이여서 좀더 정리해 서평을 다시 올려본다. 읽는중… $2 안진환 역/이언 에어즈 저 예스24 | 애드온2 사실 위 책 한권이 근래 8권의 책을 선정해서 읽는데 엄청난 영향을 끼쳤다. 대부분 사람의 의사결정에 대한 책들이다. 계량 […]

계속 읽기

HARD CODE 그리고 Tmax 컨퍼런스

작성일자 2009년 07월 08일 고감자님이 작성

사실 어제 휴가여서 아들내미와 하루종일 집을 지켰다. 아들과 장난도 치고, 밥도 먹이고, 나들이도 가고… 아마도 육아 휴직을 낸다면 이런 생활의 연속일 것이라는 생각도 하고…그러면서 Tmax관련 Twitter글들을 놓치지 않고 보고 있었다. 하지만 역시 예상대로였다. ㅠㅠ 그러다, 박재호님의 블로그 글을 보게되며 개발 문화 그러니까 코드, 테스트 그리고 여타 개발에 필요한 여러 프로세스들이 과연 Tmax가 새로운 프로덕트를 개발하는데 […]

계속 읽기

6개월 남았다…

작성일자 2009년 07월 01일 고감자님이 작성

본사 개발자하고 일하다 보니 멋진 개발자, 멋진 개발 팀 리더가 어떤건지 아주 피부로 실감을 하게 해준다. (어떤게 멋진 개발자이고 팀 리더인지는 나중에 따로 기회 있으면 자세히 포스팅 하겠다) 사실 내 경력 6년을 통틀어 봐도 이 정도의 프로젝트를 해본 경험이 거의 전무했다. 한 분야에 수십년을 해온 백발이 성성한 최고 고수부터 나처럼 처음 이런 프로젝트에 참여한 신출내기까지, […]

계속 읽기

EM 알고리즘 구현 – 오류 수정본 –

작성일자 2009년 06월 28일 고감자님이 작성

저번에 구현한 EM 알고리즘에 오류가 있어서 수정해봤다. 각 클러스터 중심을 구할 때 k-means 와 비슷하게 아예 확률값이 큰 클러스터에 포인트를 할당해 해당 클러스터 파라메터 계산시에만 확률값을 사용했는데 이런식으로 하면 안되고 한 포인트가 가지는 각 클러스터의 확률값을 가지고 이를 기반으로 각 클러스터 파라메터 재계산을 해야한다. 사실 코딩할 때 애매모호 해서 예전에 들었던 k-means와 거의 비슷하다는 강의록을 […]

계속 읽기

직관과 데이터 기반

작성일자 2009년 06월 23일 고감자님이 작성

오늘도 데이터 분석을 하면서 사람의 직관과 그리고 실제 데이터를 기반으로 해서 나온 결과물의 차이를 확인했다. 더불어 데이터 기반으로 나온 결과물들을 어떻게 직관에 의해 나온 것들과 조화를 시킬것인가 하는 그런 복잡한 문제도 잠깐이나마 고민을 해봤다. 사실 그럴듯해 보이고 꽤 괜찮은 결과를 보이는 직관의 산물들을 보면서 이를 데이터 기반으로 나온 것들과 조화시키는건 쉽지 않다. 게다가 이런 작업을 […]

계속 읽기

우리 아들 돌을 축하하며.

작성일자 2009년 06월 22일 고감자님이 작성

이달에 경조사가 많았는데, 그 중에 가장 중요한 경조사가 우리 아들 돌잔치 였다. 이를 위해 전날 새벽까지 iMovie로 만든 성장 동영상을 올려본다. 지난 1년동안 잘 커준 우리 아들에게 고맙고, 1년전에 이런 예쁜 아들을 낳아준 아내에게 고마운 마음을 전하고 싶다. 그리고 무엇보다 우리 내외가 회사에 아무 걱정없이 다닐수 있게끔 수빈이를 잘 키워주신 장모님에게 감사의 마음을 이 자리를 […]

계속 읽기

데이터만이 진실을 이야기 한다?

작성일자 2009년 06월 18일 고감자님이 작성

전문가의 시대, 대용량 데이터의 시대 약 1년 전에 썼던 포스팅의 제목이다. 왜 이 이야기를 하느냐 하면, 이 글과 관련된 책이 지난 3월에 슈퍼크런처라는 제목으로 번역되어 국내에 출간 되었기 때문이다. 사실 이 정보도 오늘 데이터 마이닝 관련 검색을 하다가 알게 되어 바로 퇴근하면서 사와 현재 열독중에 있다. 사실 이 책은 메사추세츠 대학에서 정보검색 관련 공부를 하시는 […]

계속 읽기

outlier 책을 보고.

작성일자 2009년 06월 17일 고감자님이 작성

아웃라이어 이 outlier라는 단어는 내 업무에도 상당히 많이 등장하는 단어이다. 그리고 항상 이놈들을 생각하지 않고서는 정확한 데이터 마이닝이 힘들다. 얼마전에 이 책을 한번 보라는 추천을 블로그를 통해 받아서, 주말에 주문하고 지하철에서 틈틈히 읽어 오늘 아침에 완독을 했다. 이 책을 추천한 분에게 감사하다고 말씀 드리고 싶은건 이 책은 일반적인 성공 관련 서적하고는 전혀 다른 접근 방법을 […]

계속 읽기

아파치 로그 구하기 힘들군…

작성일자 2009년 06월 17일 고감자님이 작성

이 블로그 서비스의 아파치 로그를 보내달라고 cafe24에 문의했으나 개인정보 관련 문제로 제공할 수 없다라는 답변만 받았다. 이 로그를 기반으로 외카 3회 연재때 아파치 로그와 외카를 활용한 웹 로봇 로그 분류기를 만들어볼 예정이였는데.. 일단 로그를 구할 수 없어서 마소에 3회 연재 주제 변경 요청을 해둘까 한다. 사실 imaso.co.kr 사이트의 웹 로그를 활용할 수 있는지 여부를 함께 […]

계속 읽기

Algorithms of the Intelligent Web

작성일자 2009년 06월 16일 고감자님이 작성

주문했던 Algorithms of the Intelligent Web 책이 도착했다.한 2주 걸렸나 모르겠다. 쩝 .. 점심 시간에 쭉 보고 있었는데,… 책의 예제 설명들이 괜찮은거 같다는 느낌이 든다. 게다가 이 책의 내용중에 여러 분류기를 조합해서 만드는 bootstrap bagging 을 실제 이용한 예제는 다른 책에서 보기 힘든 예제임에 확실하고…(분류기 조합의 성능은 이미 Netflix 콘테스트에서 증명이 되었으니..)게다가 다른 여타 개론 […]

계속 읽기