outlier 책을 보고.

아웃라이어

이 outlier라는 단어는 내 업무에도 상당히 많이 등장하는 단어이다. 그리고 항상 이놈들을 생각하지 않고서는 정확한 데이터 마이닝이 힘들다.

얼마전에 이 책을 한번 보라는 추천을 블로그를 통해 받아서, 주말에 주문하고 지하철에서 틈틈히 읽어 오늘 아침에 완독을 했다.
이 책을 추천한 분에게 감사하다고 말씀 드리고 싶은건 이 책은 일반적인 성공 관련 서적하고는 전혀 다른 접근 방법을 보여주고 있다는데 큰 점수를 주고 싶다. 물론 이 저자가 이야기하는 것을 무조건 일반화 해서는 안될 테지만, 나름대로 상당한 설득력을 가지고 있었고 나로 하여금 성공에 대해 다른 관점으로 보게끔 큰 영향을 끼쳤다고 생각한다. 이런 다른 관점을 제공하는 책은 나는 정말 사랑한다.

이 책을 읽게된 시발점이 되었던 포스팅은 개발 능력과 그 사람의 환경에 대한 이야기였다. 내 관점은 그 사람의 개발 능력은 그 사람 자체의 능력(타고난)보다는 그 사람이 무슨일을 해왔고, 현재 어떤 개발 문화에 몸담고 있는지가 가장 중요하다고 했다. 그리고 이런 관점은 나 자신을 겸손하게 만들었다.

데이터 마이닝 책을 보면 outlier의 정의를 이렇게 하고 있다.

“이상치는 다른 관찰들과 서로 다른 관찰로써 다른 방법을 사용하여 생성된 결과라는 의심을 불러일으키는 관찰이다”

이는 통계학자 더글라스 호킨(Douglas Hawkin)에 의한 정의인데 outlier는 예상했던 클래스의 잘못된 값들이 아닐수 있으며 또 다른 클래스를 형성하는 어떤 집단일 수 있다는 것을 시사하고 있다.

책 제목으로 보면 정말 적절한 제목이지 아닐 수 없다.

개인적인 의견은 이런 종류의 outlier를 설명한 책들이 많이 나왔으면 한다는 것이다. 이런 책들은 편협한 사고 방식을 일깨워 주는 어떤 청량제 같은 책이니까…

좋은 책 추천 감사합니다. ^^;

CC BY-NC 4.0 outlier 책을 보고. by from __future__ import dream is licensed under a Creative Commons Attribution-NonCommercial 4.0 International License.