뉴머러티.. 흥미롭게 읽은 책이나… 전에 읽었던 슈퍼크런처보다는 약간 주변을 맴도는 듯한 느낌이 드는 책이다. 역시 같은 소재이지만 교수가 쓴 책하고 디테일의 차이가 있는거 같다.
책 두께는 얇은데 종이 재질이 얇고 글자 줄 간격이 빼곡해 넘기는 재미는 없는 책이다. 하지만 그동안 번역서가 나오길 기대한 책이고 몇 안되는 데이터 마이닝 활용 수기(?) 책중에 하나라서 즐겁게 머리 식힐겸 봤다.
최근 개인적으로 모 대기업에서 DNA 데이터 분석하는 분과 이야기 할 기회도 있었는데, 이 책의 ‘환자’ 챕터와 어느정도 관련이 있어보였다. 그분과 식사 하면서 특정 병으로 죽은 사람들 DNA데이터들만 있으면 어느 부분의 DNA에서 그 질환의 발병원인이 되었는지.. 기계학습으로 풀어낼 수 있을거라는 이런 저런 생각도 하게 되었고… (여기서 생각했던게… feature selection이였는데… DNA를 학습 데이터라고 하면 그 데이터를 기반으로 각 DNA 단위를 feature로 줘서 병 발현에 가장 중요한 영향을 끼친 부분이 어딘지 feature ranking을 구하면 될거란 어렴풋한 생각들…하지만 1사람 데이터가 정제후 3T정도가 된다고 하니 대용량 프로세싱은 필수라고 한다.)
모 이런 비슷한 이야기들이 책에 많이 나와 있다.
책을 보면서 특히 환자 챕터에서 사용자의 행동 데이터를 기반으로 병의 발현을 예상하는 부분은 충분히 가까운 시일내에 사업화도 가능할 거란 생각도 해본다. 이미 핸드폰이나 각 가정의 인터넷 그리고 컴퓨터의 보급 수준만 보더라도 먼 미래 이야기는 아닌듯 싶다.
나도 역시 사용자 데이터를 기반으로 하는 어플리케이션을 만들고 있고 그 퍼포먼스가 얼마나 마법과 같은 느낌을 주는지 알고 있어서 큰 느낌은 없이 읽었으나… 이 분야에 대해서 조금이나 호기심이 있으신 분들에게는 흥미로운 책이 될거라 생각된다.

Thanks for blogging about the book. I put your text into Google translator and got only a vague idea of what you wrote. Perhaps that the material is a bit thin, trying to be funny, and that you found the patient chapter relevant and/or interesting? In any case, I appreciate any discussion the book generates. Best wishes, Steve Baker
Hi! Stephen Baker.
Wow! Wonderful search engine. You found my article in a few hours after writing, even though Korean.
Anyway, Thanks for visiting.:)
During my reading period, I met a one man who are working on Samsung, his major is DNA analysis in Grid. it was very interesting time for me and his work is somewhat related with Patient chapter in your book.
When we were talking about DNA analysis, I could mix my Machine Learning knowledge with DNA analysis using Feature selection to find which DNA can cause certain disease. this was my short thinking
And fortunately I am currently working on query analysis in Yahoo! to make query suggestion engine. It also totally based on user experiences that was mixed with huge amount of query logs. In my prj, Data becomes application itself when after they go through Machine Learning algorithm.
Your book provided a lot of new usages on data mining.
Thanks for wonderful book.
–gogamza
헉~~
영어 사용자인 저자가..한국어 사용자인 독자에게….
원더풀!!!!!!!!!!!!!!
IT가 마법은 마법인 거시야~~~~~~
이분은…트위터도 열심히 하시더군요…
네..재미있는 세상이죠, ㅋ