Machine Learning for Hacker

  Machine Learning for Hacker 컴퓨터 서적 전문 출판사에서 통계학을 넘어서 기계학습까지 넘보고 있구나. 물론 오라일리에서 나온 programming collective intelligence 가 선구자 적인 역할을 하긴 했지만 이제는 R언어로 케이스 스터디 책이 나왔다. 어제 출간이 되었던데 사파리에서 올라와 있어서 몇몇 챕터를 보고 바로 결재 처리를 해버렸다(pdf로 보기도 힘들어서…). 이런 데이터 분석 류의 책은 툴을 설명하기 보다는 […]

계속 읽기

빅 데이터 쌓기 경쟁

최근 작금의 상황을 보자면 빅 데이터를 모아서 쌓아두는데 목적을 두는 기업들이 상당히 많다는 것을 자주 느끼곤 한다. 빅 데이터를 쌓아두면 뭔가 가치 있는 정보들이 나올거라는 미신같은것 때문에 너도 나도 빅 데이터 클러스터를 구성하는데 관심을 가지고 있는 듯 하다. 물론 빅 데이터에 가는 가장 명시적인 마일스톤이 빅 데이터 처리 플랫폼을 구축하는 것이고 어쩌면 이는 돈을 투자하면 […]

계속 읽기

흉내내기 힘든 인간 지적판단과 지능형 소프트웨어

요 데이터마이닝 관련 프로젝트는 많은 소프트웨어 개발자들이 느끼는 개발자 자신의 겸손한 자세를 요구하는것과 더불어 인간 지적판단의 위대함을 다시한번 느끼게 해주는 몇 안되는 프로젝트이다. 많은 소프트웨어의 버그 해결 과정은 깊은 자기 반성의 시간이 된다. 자신에 대한 확신이 강한 사람은 심지어 컴파일러까지도 의심하지만 대부분의 경우 본인에게 문제가 있다. 이런 과정이 반복되고 경험이 쌓이면 개발자 자신이 자신에 대해서 […]

계속 읽기

Data Mining, Third Edition: Practical Machine Learning Tools and Techniques

Data Mining, Third Edition: Practical Machine Learning Tools and Techniques (The Morgan Kaufmann Series in Data Management Systems) 2판은 현재 내 책상 위에도 있을 정도로 즐겁게 참고하는 책이 되어 버렸다. 2판이 나온지 5년이 되가고 있고 3판 언제 나올까? 하고 찾아보고 있었는데 2011년 초 출간 예정이다. 역시 최신 트렌드를 다루고 있다.대용량 데이터 셋 처리, 앙상블 러닝, […]

계속 읽기

데이터를 분석한다면 참고가 될 좋은 책 몇 가지

1. Head First Statistics2. Head First Algebra 3. Head First Data Analysis  (출간 예정) Head First 시리즈는 뭔가 출간 스토리라인이 있는거 같다는 느낌을 요즘 많이 받는다. 위 시리즈를 순서대로 읽는다면 앞으로 Data Mining이나 Machine Learning을 공부하는데 큰 도움이 될거라 믿어 의심치 않는다. 2번 책은 이미 주문해서 아마도 월요일정도 받아서 읽어보지 않을까 한다. 그리고 1번책의 경우 […]

계속 읽기

현실 세계의 기준들을 어떻게 하면 숫자로 표현할 것인가?

요즘 고민하는 화두다. 말 그대로 Data Mining의 전처리 단계라고 볼 수도 있는데, 사실 collective Intelligence라는 책을 보면서 다시 한번 놀랐던것이 현실적인 수치적 문제(돈, % 등) 뿐만아니라 다른 것들, 예를 들어서 성별, 취미 등 의 그런 데이터를 어떻게 수치화 해서 표현하고 그것들의 의미를 목적에 맞게 모델링하는 과정을 보면서 꼭 이 부분에 대해서는 다양한 방법론을 공부해야 겠다는 […]

계속 읽기

이번학기 중점 과목

저번 학기부터 교수님에게 개설해 달라구 노래를 불렀던…. Data Mining 과목이 이번에 학기에 개설이 되었다. 대학원은 실제 과목 이름이 애매할 경우가 있어서 의심이 가는 과목은 되도록 첫 강의 시간에 들어가서 들어봐야 한다. 어제의 과목 이름도 “지능형 실시간 시스템”이였는데, 저번학기에는 Machine Learning 으로 강의를 하셨고, 이번학기는 Data Mining으로 강의를 하신다. 첫 시간부터 Data Mining에서 Spam에 관련된 질문을 […]

계속 읽기