Code Freeze 폭풍 전야에 R 도서 리뷰나..

오늘 원래 회사 4시에 퇴근 할 수 있는 날인데, 지금 새로 작성된 코드들 디버깅과 실제 런타임 테스트를 하고 있다. 한 2시간 전까지만 해도 심각한 버그를 가지고 있어서 금방 프로세스가 assert문으로 죽어 버리곤 했는데, 원인을 발견해 고쳐서 현재 열심히 테스트 모델 빌드중에 있다.
아마도 이번 빌드 마지막 코드 체크인은 내일 아침 그러니까, 미국 시간으로 오후 늦게나 하게 될 듯 하다.

사용자 삽입 이미지from http://www.flickr.com/photos/jhindmon/1455603760/

이번에 절절하게 느꼈는데, 방어적인 코딩 방식이 얼마나 버그를 막는데 도움을 주는지 피부로 실감할 수 있었다. 아무리 코딩을 잘 한다 하고 경력이 많아 실수를 안할거라 생각하지만, 결코 이 코딩의 세상에서는 완벽함을 부르짓어서는 절대 안된다는 겸손한 생각을 다시 한번 해본다.
리뷰동안 방어적인 코드를 주장하는 팀원분들 덕분에 프로그램도 쾌적하고 깔끔하게 돌아가는 느낌을 받고 있는 중이다.. 기분 탓인가? ㅋ

여튼 모델 빌드는 진행중이고… assert 지뢰가 터지면 바로 달려가 디버깅 하겠지만, 잘 돌아갈 듯 보인다. (수천개의 데이터를 돌려보고 잘 돌아간다면 코드 체크인 해도 무방하리라 생각한다. 역시 안정성 테스트는 예상되는 입력을 잘 샘플링해 되도록 많이 집어 넣고 테스트 하는게 최고다.)

다름이 아니라 요즘 새로 구입해서 읽는 R in a Nutshell 이야기를 이 틈에 하고자 한다. 사실 R을 잘 사용하기 위해서라기 보다. 내가 좋아하는 업무 성격들이 잘 반영된 언어라서 그런 욕구 추구 측면에서 틈틈히 공부하는 언어중에 하나이다. 작년에는 이 언어를 이용해서 논문 데이터 분석 알바를 한적이 있는데, 덕분에 이 언어를 공부하는 책값을 구하는데는 도움이 참 많이 되었다. (하지만 어떤분은 R은 교수님이 모른다고, SAS를 이용해 돌려달라고 하는 그런 요구도 있었다. 결국 결과는 같은데 말이다.)

사용자 삽입 이미지

책의 저자는 온라인에서 광고를 파는 더블클릭(구글이 몇년전에 인수한)의 개발팀장이였고, 관련 데이터를 분석하기 위해 이 언어를 상당히 심도깊게 사용한 듯 하다. (뭐 내용을 보면 금방 알 수 있다)

이 책은 R을 아주 기초부터, 머신러닝의 영역인 분류나, 회귀분석까지 다루고 있고, 무엇보다 책이 가독성이 좋아 흡사 국내서를 보는 듯한 착각이 일 정도이다. 읽어보면 알겠지만 거의 중학교 수준의 영어면 이해하는데 큰 문제가 없을 정도이다.
무엇보다 맘에 드는건 틈틈히 등장하는 사용팁들인데, 이 팁들이나 기교가 언어를 이해하는데 많은 도움이 되더라..

아마도 이 포스팅을 읽으시는 분들이 head first statisticsstatistics in a nutshell을 아주 재밋게 봤고, 충분히 숙지를 했다면, 그 활용을 위해 이 R언어를 배워봄직도 할거라 생각한다.

책의 뒷부분에 상당히 재미난 예제들이 많이 나온다는 저자의 이야기가 있는데, 빨리 읽어보며 즐거움을 만끽해야 겠다.

CC BY-NC 4.0 Code Freeze 폭풍 전야에 R 도서 리뷰나.. by from __future__ import dream is licensed under a Creative Commons Attribution-NonCommercial 4.0 International License.