R을 처음 배우고 싶어하는 분들이 가장 어려워 하는 이유는 R을 단순히 일반적인 프로그래밍 언어로 접근하기 때문이 아닌가 한다. 따라서 언어를 이해하기 위해 통계나 데이터 마이닝 공부를 병행하는 것을 추천한다.
R을 가장 잘 이해하기 위해 개인적으로 가장 추천하는 방법은 언어 문법을 익히고 관련 기초 통계를 R을 기반으로 실습해 보는 것이다. 그리고 마지막 단계로 kaggle이나 CrowdANALYTIX와 같은 데이터 마이닝 대회에 참가해보고 자신의 분석 방법을 적용해보는 것을 반복하는 것이다. 물론 이런 대회에 나가려면 최소한 데이터 마이닝 서적 한권 정도는 이해를 해야 하지만, 실전 연습 자체가 R이 왜 데이터 마이닝/분석에서 가장 많이 쓰이는지 이해하는 가장 빠른 방법이기 때문에 이런 과정을 거치면 언어를 연습할 때 어렵던 개념들이 분석을 용이하게 하는 중요 언어 특징으로 변모되는 순간을 경험할 수 있을 것이다.
그나마 가장 편한 방법이 책을 통한 방법이니 몇 가지 책을 추천해 보도록 하겠다.
R in a nutshell : 아무래도 프로그래머적 관적으로 R언어를 설명하고자 한 최초의 책이 아닌가 싶다. 물론 뒷 부분에 통계나 마이닝 관련 기법들이 나오긴 하지만 책 전반적으로 R언어에 대한 심도 깊은 설명들이 나오는 책이다. 온라인 광고 관련된 회사에 있던 저자가 쓴 책
R Cookbook : R 문법을 이해하고 볼 수 있는 레퍼런스 용도로 정말 좋은 책…
예제로 배우는 R 프로그래밍 : 역시 레퍼런스 용도의 책인데, 국내서로서 R 프로그래밍 언어를 다루는 최초의 책.
최소한 통계학 개론 정도는 뗏다고 생각한다면 다음을 시도해 보자!
R을 이용한 누구나 하는 통계 분석 : 통계분석을 R로 쉽게 정리한 이 정도의 국내서가 있다는 게 자랑스러울 정도임. 글자 하나하나마다 저자의 공력이 녹아 있다.
데이터 마이닝(방송대 4학년 교재) : 2011년 8월에 개정 출간된 교재로 기존의 S-Plus기반의 코드를 R로 다 바꾼 개정판. 일반 시중 서점에서는 구하기 힘들고, 방송대 지정서점이나 방송대 온라인 서점에서 구할 수 있다. 국내에서 출간된 데이터 마이닝 서적으로는 가장 쉽게 접근할 수 있는 책이 아닐까 한다.
Data Mining with R : 주식 예측하는 챕터만 제외하면 상당히 참고할 것이 많은 R 데이터 마이닝 책, 데이터 마이닝 업무의 특징과 과정을 챕터 주제를 통해서 이해할 수 있는 책
온라인 레퍼런스들이 상당히 많은데, R프로젝트 사이트에서 제공하는 An Intorduction to R을 가장 먼저 추천한다.
방송대 교재중에 R을 사용하는게 있군요! 가격도 저렴하고, 예전에 배운 데이터마이닝 공부도 다시 할겸 이 책으로 시작하면 될 것 같네요. 좋은 정보 감사합니다! 🙂
아..네… 책 좋아요…잘 보세요…
R을 주제로 한 블로깅을 하는 분을 만나 반갑습니다.
R을 이용해서 웹 상의 다양한 자료를 불러와 분석하는데,
혹시 ‘한글’ 처리는 어떻게 해야할까요?
예를 들어 트위터 API를 제원하는 twitteR 패키지를 이용,
한글로 작성된 트윗들을 불러오면, 모두 한글이 깨져서 나옵니다.
아마도 인코딩 문제 떄문인 듯한데,
웹 상의 한글 문서를 직접 R로 불러들일 경우,
한글 인코딩 문제는 어떻게 해결해야 하는지 궁금합니다.
RCURL 패키지의 오작동 문제라고 하더군요. 일단 한글을 R 내부에서 표현하는데 제약은 없습니다.
좋은 정보 알아가네요. R 교재 정보가 인터넷에 올라올줄이야..
R도 좋고 WEKA도 좋습니다. 물론 이것들을 조금더 편하게 UI를 이용하여 분석해보려면 KNIME을 이용해서 해보심도 좋을듯합니다. 저는 제품개발과 제조분야의 Big Data를 이용하여 분석하는 알고리즘 개발시 KNIME Platform에서 R과 WEKA를 이용해서 여러분석을 해보는데 무척편리하더군요. 물론 KNIME와 JAVA를 잘아신다면 본인만의 것을 만들어낼수도 있겠지요..
네 참고하겠습니다.