RStudio New Version 리뷰 (V. 0.98.932)

RStudio는 R을 사용하는데 필수 불가결한 에디터 중에 하나이다. 특히나 뛰어난 분석 통합 환경과 더불어 RR(Reproducible Research)관련 기능은 정말 타의 추종을 불허한다. 필자가 이렇게 RStudio 새로운 버전을 리뷰하는 이유는 금번 버전업에 RR관련 많은 내용들이 추가되었기 때문이다.   관련 업데이트 내용은 아래와 같으며 Markdown v2에 대한 설명은 이 링크에서 볼 수 있다.    R Markdown Next generation of […]

계속 읽기

진정한 R 사용자의 축제…

10년 넘게 이런저런 커뮤니티를 활동하면서 느낀 부분은 10년 전 만큼의 커뮤니티의 순수성이 많이 없어지고 있다는 것이었다. 이런 문제에 많은 실망을 하는 바람에 오래 알던 지인들과 다투기도 하는 상황이 벌어지기도 일쑤여서 제작년 이후로는 커뮤니티 활동을 하지 않고 있었다. 특히 R커뮤니티의 경우 다양한 분야와 엮일 수 있는 아주 큰 접점이 되는 기술이여서 그 혼탁함은 이루 말할 수 […]

계속 읽기

Heartbeat

마지막 블로그 포스팅을 쓴지 한달 반이 지나 뭔가 블로그에 써야될듯 한 그런 사명감때문에 무작정 이렇게 텍스트 에디터를 열었다. 간단하게 최근 현황을 말해본다면 회사 내에서는 맨하튼 프로젝트의 핵폭탄처럼 뭔가 엄청난 왕건이들을 분석하고 만들고 있다는 것과 그 왕건이 중에 큰 애정을 가지고 있는 것이 매우 잘 동작해 흡사 살아있는 생물처럼 느껴진다는 사실 정도라 이야기 해본다. 그 일에 […]

계속 읽기

글쓰기 혹은 책쓰기의 함정…. citation…

오늘 참으로 이상한 전화를 받았다. 내 코드가 책에 쓰였는데, 양해를 구하고 싶다는 전화였다. 그래서 나는 citation(“KoNLP”)의 출력 텍스트가 참고문헌이나 footnote로 들어가면 아무문제 없다고 했고 텍스트에 내 이름을 직접 언급하거나 이렇게 전화로 연락할 필요 없다고 하고 전화를 끊었다. 이 전화를 받고 몇년전에 내가 작성한 블로그 글의 citation을 명확하게 하지 않아 벌어졌던 연말 해프닝이 기억이 났다.  사실 […]

계속 읽기

R 실무 데이터 분석 세미나 참고자료

R 실무 데이터 분석 세미나에 참여해 주셔서 감사드립니다. 저도 이번 시간을 통해 R 사용자들이 어떤 부분에 관심이 있고 궁금해 하는지 잘 이해할 수 있었습니다. 이날 정말 많은 내용들을 전달해 드리려 쉬는시간도 거의 없이 7시간을 계속 이야기 했는데도 시간 관계상 간단하게 언급한 내용들과 사전에 공유를 드리지 못한 자료들을 이곳에 올려 놓으니 많은 참고 바라겠습니다. extrafont를 사용한 […]

계속 읽기

라즈베리 파이를 이용한 라이프 로깅 시작

큐비보드, 비글보드 블랙을 거쳐 오랜 시행착오 끝네 라즈베리파이에 안착했다. 역시나 라즈베리파이를 만나고 나서 이쪽으로 강렬한 이끌림을 받았으며 이런 저런 창조력을 발휘발 생각에 매일 오감이 자극될 지경이다. 내가 관심 있어하는 것은 내가 흘리고 다니는 나의 데이터이다. 내가 흘리고 다니는 것이라 모두 안다고 치부하기에는 이 데이터는 너무 객관적인 데이터이라는 특징 있다. 여름이 왔으니 일단 실내 온도에 관심이 […]

계속 읽기

R 미러링 서버 로그 분석(2)

한국 사용자들의 R 패키지 이용 현황을 보여주려 한다. RStudio 미러 서버가 전체 한국 사용자를 대변하기는 힘들테지만 RStudio 에디터의 기본 미러링 설정이 RStudio 서버로 되어 있으니 기본 설정 그대로 쓰는 사용자 습성을 볼때 어느정도 의미는 있을 거라 생각한다. library(ggplot2) library(lubridate) library(plyr) if (!require("devtools")) install.packages("devtools") require("devtools") # make sure you have Rtools installed first! if not, then […]

계속 읽기

R 미러링 서버 로그 분석

예전에 한국 cran 미러링 서버를 구축하면서 미러링 서버의 웹 서버 로그를 기반으로 몇 가지 시각화를 해서 공개 세미나에서 분석 결과를 공유했던 적이 있었다. 사실 이런 로그 공개 작업에 대해서 개인적으로 고민한 적이 있었는데, 얼마전에 RStudio에서 관련 작업을 했던 결과를 공개하고 말았다. 그러면서 나도 로컬 cran 미러링에서 RStudio로 넘어오게 되었는데, 이 이유는 RStudio의 미러렁 서버가 AWS […]

계속 읽기

저렴한 시스템에서 대용량 데이터 학습하기

저렴한 시스템에서 대용량 데이터 학습하기 데이터 레코드가 10만개 정도, 그러나 필드가 500개. 그러나 분석가가 가지고 있는 R 시스템은 정말 아주 일반적인 시스템이라 하자. 예를 들어 윈도우 7 32bit, 4GB램… 위의 상황일때 지금같으면 램을 증설하고 윈도우 7 64비트 OS로 바꾸는 작업을 할텐데, 이런 쉬운 결정이야 지금에야 어느정도 가능하지만 불과 몇년전 까지만 해도 간단한 일이 아니었다. 아래 […]

계속 읽기