Toby Segaran의 인터뷰

오늘 아침에 토비의 블로그에 가서 정신없이 토비 세가렌의 20여분간의 인터뷰를 봤다. 책을 보다 보니 더 자세하게 이 사람의 이력을 알고 싶었고, 집단지성 책에서 쓰인 AI알고리즘에 대한 자신의 생각을 알고 싶었다. 인터뷰에서는 많은 내용이 나오는데, 인터뷰를 하는 사람이 상당히 이쪽 세계에 대한 식견이 좀 있는 분이여서 그런지 질답이 흥미롭게 오갔다. 간단한 이력과, ML과 Python 이야기, 그리고 […]

계속 읽기

Erlang으로 구현한 분산처리 플랫폼 : PDF 공개

금번 8월 월간 마소에 올렸던 Erlang관련 기고문을 공개한다.   한달정도 지나면 공개해도 된다는 말씀을 기자 분에게 들었었고 게다가 저작권이 본인과 월간 마소에 있어서 큰 문제가 없다고 생각한다.   글을 쓰면서 지면 여건상 많은 내용을 넣지 못한것이 조금 아쉬웠다. 11장으로 집약하기에는 부족한 감이 없지않아 있지만 초보분들에게는 좋은 시작점이 될 수 있을거란 생각을 해본다. 추가적으로 리서치가 되는 […]

계속 읽기

온라인 쇼핑몰 검색에 대한 생각

약 3년전에 “G마켓과 옥션 검색엔진 간단 비교“라는 글을 쓴적이 있었다. 왜 3년전 글에 대한 이야기냐 하면은 이 글이 아직도 쇼핑몰 검색에 대한 이야기를 할대 자주 언급이 된다는 이야기를 들었기 때문이다. 그러나 3년이 지난 지금, G마켓 검색은 여전히 정확도가 그렇게 높지 않다. 사실 이 부분은 G마켓 검색팀장님에게도 문의를 수도없이 드린 부분이고 많은 이야기를 했던 부분이다. 나의 […]

계속 읽기

통계학 공부를 마치고…

회귀분석을 끝으로 통계학 공부를 마쳤다. 끝났다고는 하지만 뭐 책을 한번 쭉 봤다는 정도고, 아마도 옆에 두고  계속 보면서 통계학 분석의 마인드는 항상 가지고 가는게 좋을거 같다는 생각이 든다. 다음에 보는 책은 “실전 웹사이트 분석- 성공적인 온라인 마케팅을 위한 웹데이터 분석과 활용“이라는 책이다. 사실 이 책은 사내 독서동아리에서 원서를 신청했다가 번역본이 나왔다는 이야기를 듣고 번역본을 받아봤다. […]

계속 읽기

확률 통계는 교양이다?

이걸로 밥 벌어먹고 사는 사람이야 많이 있겠지만 데이터를 핸들링 하는 엔지니어로서는 확률 통계는 반드시 알아야될 교양 정도라고 생각했다. 이거 모른다고 개발자를 못하는건 아니니까… 많은 책들의 서문에 아래와 같은 말들이 많이 써져 있다. “OOO에 대해서 알면 정말 좋지만 몰라도 책을 이해하는데 큰 어려움은 없다” 위와 같은 감언이설에 넘어가서 책을 보다가 큰코 다친적이 한두번이 아니다. 그중에 확률 […]

계속 읽기

나의 새로운(?) 검색 교과서

8월 중순에나 받을 줄 알았는데 책이 도착해 있었다. 아마도 휴가를 냈던 금요일날 온게 아닐까 한다. 디카가 없어서 eeepc 웹캠으로 살짝… 먼저번 김진영님이 포스팅에서 소개했듯이 두번째 저자분이 야후 리서치의 책임자 분이시다. 저자분 약력보다 내용을 먼저 보면서 야후에서 쓰이는 검색기술 용어가 빈번하게 쓰이는걸 보고 꽤나 놀랐었는데 역시나 야후 리서치 센터에서 참여를 했었다. 김진영님이 책을 보시고 하신 “clustering […]

계속 읽기

얼랭(Erlang)과 Map/Reduce

마소 기고문 쓰다가 발견한 자료다.얼랭언어에 대한 간략한 소개 후에 간단한 Map/Reduce 알고리즘을 구현/설명을 하고 있다. Exploring Erlang with Map/Reduce 블로그에 올린 공짜글 치고는 정말 좋은 글이다.

계속 읽기

Facebook에서 Erlang으로 채팅서버를 구현했다는…

전에 Erlang으로 hadoop같은 분산처리 어플리케이션을 손쉽게 만들 수 있을거 같다는 포스팅을 쓴적이 있다.  지금 보면 허접한 포스팅이 아닐 수 없었는데 점점 그런 생각들이 실례로 드러나고 있다. 이미 FaceBook의 대용량 처리 어플리케이션에 Erlang이 쓰이고 있다는 글이 올라 왔다. … Erlang is the key tools for building large scale applications, especially for social networks… 새로운 채팅 서버를 […]

계속 읽기

p-value ‘ex)랭킹 가설검정’

요즘 통계학 공부를 좀 하고 있다는 이야기를 했다. 하다보니 역시 확률 이야기들이 많이 나온다. 우리가 통계툴을 보다 보면 p-value라는 말이 많이 나온다. 대충 숫자가 크면 가설을 지지하는걸로 알고 있고, 작으면 가설을 부정하는 결과를 가져올 수 있다는것만 어렴풋이 알고 있었다. 물론 이정도만 알고 있어서 큰 문제는 되지 않지만 공부하는 목적이 직접 이런 테스트 검정을 해보는게 목적이니 […]

계속 읽기

Introduction to Information Retrieval 출간!

Introduction to Information Retrieval 짧게 IIR이라고도 불리우는 책이 계속 출간 연기가 되다가 드디어 출간이 되었다.사실 이 책은 몇일 전까지만 해도 올해 8월중에 출간을 목표로 하고 있었다. 하지만 오늘 찾아보니 지난 7일에 출간하였더라. 서둘러 amazon에서 주문을 마치고 글을 쓴다. 이 책에 대한 극찬들이 하도 많아서 나열하기도 힘들다. ㅎㅎ 책의 draft가 어떻게 변해가는지 꾸준히 지켜봤었다. 약 10개월 […]

계속 읽기