일상

고감자 on 5월 11th, 2012

요즘 여러 기고 요청을 받고 인터뷰를 받아서 개인적으로 고민하고 경험했던 부분들에 대해서 정리할 기회가 있었다. 물론 가장 큰 화두인 빅 데이터에 대한 것이다. 일단 빅 데이터 화두의 중심에서 실무를 하고 있는지라, Bias되어 있는 의견을 보일 수 있겠으나 블로그에서는 항상 내 생각만을 공유해 왔으니 한줄 써보련다. 사실 빅 데이터를 가지고 가치를 내는 분들은 오래전부터 우리 주변에 [...]

Continue reading about 빅 데이터… 웹 2.0…. 그리고 검색

고감자 on 4월 21st, 2012

구글 피드 버너에서 이 블로그에 대한 통계 데이터 csv 파일을 다운받아서 ggplot2로 플로팅 해봤다.   아래 보면 2010년 중반의 갑작스런 구독자 감소는 데이터 누락인지, 아니면 많은 RSS 리더기 업체가 서비스를 중단해서 그런건지 모르지만 결국 구글 리더가 흡수했는지 전체적인 증가 추세에는 큰 영향이 없는걸로 보인다. (아주 짧은 주기의 상승 하강이 있는데, 이런 것을 보니 평활화를 해야 [...]

Continue reading about 블로그 구독자 증가 추이

고감자 on 4월 12th, 2012

UseR! 2012에 abstract를 제출했다는 이야기를 했었는데, 그 결과를 금주 초에 받게 되었다. 결과는 예상했던 대로 accept… Text Mining을 이용한 SNA인데.. 이 발표의 abstract를 제출한 이유는 일단 회사에서 해외 발표를 할 경우에는 출장 형식으로 지원을 해준다는 것이 컸고 이번 기회를 빌어서 메일로만 이야기 했던 분들하고 안면을 좀 트고.. 첫날에 있을 Tutorial 세션에서 좀 배워보고자 하는 욕구가 [...]

Continue reading about UseR! 2012에 발표자로 참석 예정

고감자 on 3월 25th, 2012

외근, 몸살에 시달리면서 준비한 발표자료로 3회 R meetup 발표를 했다. 금번 모임 주제는 시각화(visualization)였으며, ggplot2를 살펴보는 와중에 전에 링크드인 분석가가 했던 이야기 “"Visualization is more important than you think."가 계속 머리속에 맴돌았다. 데이터 분석에서 생각보다 중요한 것…. 시각화…   국내 R 사용자를 위해 R meetup을 하자고 처음 제안한 이후에, 생각해보니 2회만 제외하고 모두 발표를 했다. [...]

Continue reading about Hello ggplot2

고감자 on 3월 23rd, 2012

최근에 KoNLP가 업데이트 되었으며, 업데이트 내용은 아래와 같다. Version 0.7 —————————————————————————— * new dictionary added which from Sejong projects * added example * Set "dontrun" on example code because Windows encoding problems. * Warning message may appear if system doesn’t have Hangul encoding ability(no warning on UTF-8). Version 0.0-9.3 —————————————————————————— * added user dictionary manage [...]

Continue reading about KoNLP 0.7 업데이트