뉴머러티(The Numerati)


뉴머러티.. 흥미롭게 읽은 책이나… 전에 읽었던 슈퍼크런처보다는 약간 주변을 맴도는 듯한 느낌이 드는 책이다. 역시 같은 소재이지만 교수가 쓴 책하고 디테일의 차이가 있는거 같다.

책 두께는 얇은데 종이 재질이 얇고 글자 줄 간격이 빼곡해 넘기는 재미는 없는 책이다. 하지만 그동안 번역서가 나오길 기대한 책이고 몇 안되는 데이터 마이닝 활용 수기(?) 책중에 하나라서 즐겁게 머리 식힐겸 봤다.

최근 개인적으로 모 대기업에서 DNA 데이터 분석하는 분과 이야기 할 기회도 있었는데, 이 책의 ‘환자’ 챕터와 어느정도 관련이 있어보였다.  그분과 식사 하면서 특정 병으로 죽은 사람들 DNA데이터들만 있으면 어느 부분의 DNA에서 그 질환의 발병원인이 되었는지.. 기계학습으로 풀어낼 수 있을거라는 이런 저런 생각도 하게 되었고… (여기서 생각했던게… feature selection이였는데… DNA를 학습 데이터라고 하면 그 데이터를 기반으로 각 DNA 단위를 feature로 줘서 병 발현에 가장 중요한 영향을 끼친 부분이 어딘지 feature ranking을 구하면 될거란 어렴풋한 생각들…하지만 1사람 데이터가 정제후 3T정도가 된다고 하니 대용량 프로세싱은 필수라고 한다.)

모 이런 비슷한 이야기들이 책에 많이 나와 있다.

책을 보면서 특히 환자 챕터에서 사용자의 행동 데이터를 기반으로 병의 발현을 예상하는 부분은 충분히 가까운 시일내에 사업화도 가능할 거란 생각도 해본다. 이미 핸드폰이나 각 가정의 인터넷 그리고 컴퓨터의 보급 수준만 보더라도 먼 미래 이야기는 아닌듯 싶다.

나도 역시 사용자 데이터를 기반으로 하는 어플리케이션을 만들고 있고 그 퍼포먼스가 얼마나 마법과 같은 느낌을 주는지 알고 있어서 큰 느낌은 없이 읽었으나… 이 분야에 대해서 조금이나 호기심이 있으신 분들에게는 흥미로운 책이 될거라 생각된다.

CC BY-NC 4.0 뉴머러티(The Numerati) by from __future__ import dream is licensed under a Creative Commons Attribution-NonCommercial 4.0 International License.