R 기반의 데이터 시각화(가제)
저자
전희원(madjakarta at gmail.com)
책 소개
필자가 블로그를 운영하거나 기고를 하면서 썼던 글들을 한곳에 정리해 한권의 책으로만들기 위한 목적을 가지고 작업을 했으며, R로 복잡한 통계분석을 하기 보다는 시각화를 중심으로 데이터를 스스로 가지고 놀 수 있는 여러 기법을 소개하고자 한다.
ggplot2를 기준으로 하는 시각화가 첫번째 주제로 정리가 될 것이며, 두번째 주제로는 다양한 데이터를 기반으로 재밋는 데이터 마이닝이나 텍스트 마이닝을 수행하는 주제로 정리될 것으로 계획하고 있다.
저작권
저작권은 전적으로 저자에게 있으며 원본 그대로의 책은 누구든지 배포의 자유를 가지나 무단으로 개작/수정을 하여 2차적 저작물을 배포하는 것은 금지한다.
작업환경
‘R + knitr + Latex + RStudio + bitbucket’을 기반으로 윈도우 7 머신 상에서 작업하고 있으며, 이런 오픈소스 기술이 집필에도 아주 유용하게 사용될 수 있다는 것을 피부로 실감하고 있으며 도구들을 만든 개발자들에게 깊은 감사의 마음을 전한다.
목차
- R로 하는 데이터 시각화의 시작
- 시각화의 중요성
- 몇가지 시각화의 예
- 앞으로 방향
- R 프로그래밍
- 인터렉티브 분석 (interactive analysis) 과 R
- R을 설치하자
- R GUI와 IDE환경 소개
- RStudio를 이용하자
- R 프로그래밍
- Data munging with R
- 들어가며
- R BASE 집계 함수 소개
- tapply, aggregate, by 함수
- plyr 패키지
- data.table 패키지
- 왜 멍잉 (munging) 을 하느냐?
- ggplot2를 이용한 R 시각화
- 왜 ggplot2이 필요하나?
- 문법 (GRAMMAR OF GRAPHICS)
- 레이어를 이용한 ggplot2 시각화
- GEOM
- STAT
- 위치 조정
- GEOM과 STAT의 결합
- 마지막 예제
- 장을 마치며
- 잉크스케이프를 활용한 그래프 후처리
- 환경 설정하기
- 예제 그래프 만들기
- 잉크스케이프로 그래프 후처리하기
- 그래프 후처리와 나머지 작업
- R로 그래프 플로팅을 하기 위한 몇 가지 팁
- 웹으로 게시할 그래프에 J(E)PG 를 사용하지 말자
- anti-aliasing 을 활성화 하라
- 정확한 디바이스 드라이버를 사용해 그래프를 저장하라
- 필요시, 고해상도 이미지로 출력하라
- 출력을 위해서라면 PDF를 활용하라
다운로드
Rvis_20130503.pdf : 최종 갱신일 (2013-05-03)
책은 지속적으로 업데이트 될 예정이다.
책은 현재 이런 과정을 거쳐 이북으로 출판이 되어 더이상 오픈된 책에 대해서는 업데이트를 할 수 없음을 알려드립니다.
R 기반의 데이터 시각화(5장, 6장 추가) by from __future__ import dream is licensed under a Creative Commons Attribution-NonCommercial 4.0 International License.