Heartbeat
마지막 블로그 포스팅을 쓴지 한달 반이 지나 뭔가 블로그에 써야될듯 한 그런 사명감때문에 무작정 이렇게 텍스트 에디터를 열었다. 간단하게 최근 현황을 말해본다면 회사 내에서는 맨하튼 프로젝트의 핵폭탄처럼 뭔가 엄청난 왕건이들을 분석하고 만들고 있다는 것과 그 왕건이 중에 큰 애정을 가지고 있는 것이 매우 잘 동작해 흡사 살아있는 생물처럼 느껴진다는 사실 정도라 이야기 해본다. 그 일에 […]
계속 읽기당신의 나의 뜨거운 감자!
오늘 참으로 이상한 전화를 받았다. 내 코드가 책에 쓰였는데, 양해를 구하고 싶다는 전화였다. 그래서 나는 citation(“KoNLP”)의 출력 텍스트가 참고문헌이나 footnote로 들어가면 아무문제 없다고 했고 텍스트에 내 이름을 직접 언급하거나 이렇게 전화로 연락할 필요 없다고 하고 전화를 끊었다. 이 전화를 받고 몇년전에 내가 작성한 블로그 글의 citation을 명확하게 하지 않아 벌어졌던 연말 해프닝이 기억이 났다. 사실 […]
계속 읽기R 실무 데이터 분석 세미나에 참여해 주셔서 감사드립니다. 저도 이번 시간을 통해 R 사용자들이 어떤 부분에 관심이 있고 궁금해 하는지 잘 이해할 수 있었습니다. 이날 정말 많은 내용들을 전달해 드리려 쉬는시간도 거의 없이 7시간을 계속 이야기 했는데도 시간 관계상 간단하게 언급한 내용들과 사전에 공유를 드리지 못한 자료들을 이곳에 올려 놓으니 많은 참고 바라겠습니다. extrafont를 사용한 […]
계속 읽기어제(2013.07.12) 발표한 단기강좌 마지막 세션인 ‘Enjoying Data with R’의 발표자료 올려드립니다. Enjoying Data with R 다른 리소스들
계속 읽기큐비보드, 비글보드 블랙을 거쳐 오랜 시행착오 끝네 라즈베리파이에 안착했다. 역시나 라즈베리파이를 만나고 나서 이쪽으로 강렬한 이끌림을 받았으며 이런 저런 창조력을 발휘발 생각에 매일 오감이 자극될 지경이다. 내가 관심 있어하는 것은 내가 흘리고 다니는 나의 데이터이다. 내가 흘리고 다니는 것이라 모두 안다고 치부하기에는 이 데이터는 너무 객관적인 데이터이라는 특징 있다. 여름이 왔으니 일단 실내 온도에 관심이 […]
계속 읽기한국 사용자들의 R 패키지 이용 현황을 보여주려 한다. RStudio 미러 서버가 전체 한국 사용자를 대변하기는 힘들테지만 RStudio 에디터의 기본 미러링 설정이 RStudio 서버로 되어 있으니 기본 설정 그대로 쓰는 사용자 습성을 볼때 어느정도 의미는 있을 거라 생각한다. library(ggplot2) library(lubridate) library(plyr) if (!require("devtools")) install.packages("devtools") require("devtools") # make sure you have Rtools installed first! if not, then […]
계속 읽기예전에 한국 cran 미러링 서버를 구축하면서 미러링 서버의 웹 서버 로그를 기반으로 몇 가지 시각화를 해서 공개 세미나에서 분석 결과를 공유했던 적이 있었다. 사실 이런 로그 공개 작업에 대해서 개인적으로 고민한 적이 있었는데, 얼마전에 RStudio에서 관련 작업을 했던 결과를 공개하고 말았다. 그러면서 나도 로컬 cran 미러링에서 RStudio로 넘어오게 되었는데, 이 이유는 RStudio의 미러렁 서버가 AWS […]
계속 읽기저렴한 시스템에서 대용량 데이터 학습하기 데이터 레코드가 10만개 정도, 그러나 필드가 500개. 그러나 분석가가 가지고 있는 R 시스템은 정말 아주 일반적인 시스템이라 하자. 예를 들어 윈도우 7 32bit, 4GB램… 위의 상황일때 지금같으면 램을 증설하고 윈도우 7 64비트 OS로 바꾸는 작업을 할텐데, 이런 쉬운 결정이야 지금에야 어느정도 가능하지만 불과 몇년전 까지만 해도 간단한 일이 아니었다. 아래 […]
계속 읽기The Metropolis-Hastings algorithm 이전 포스팅인 Rejection sampling 이나 Sampling-Importance-Resampling algorithm과 같이 특정 확률분포 함수로부터 샘플링을 추출해 확률값을 근사시킬 수 있는 알고리즘이다. 다만 마르코프 체인의 개념을 이용해 이전확률값을 기준으로 현재 확률값을 평가해 이 기준에 만족하는 경우 샘플을 수용하고 아닐 경우 과거 샘플을 다시 넣는 방식을 사용한다. 흡사 Rejection Sampling과 개념은 비슷하나 Rejection 샘플링의 경우 샘플을 버리는 […]
계속 읽기