트위터 팔로워들의 자기소개 분석을 이용한 나

최근 rjson이 업데이트 되었는데, 정말 기다리고 기다리던 CJK 인코딩 문제가 해결되었다. 그래서 이것을 활용하는 twitteR 패키지에서 이젠 정상적으로 한글이 나오게 되었다.  이 패키지를 활용하면 트위터 팔로워들 그리고 내가 팔로잉 하는 사람들의 정보를 가져와서 분석할 수 있고, 이 밖에도 그들 각자의 트위터 문장을 분석할 수 있다. 비로소 KoNLP가 가장 많이 활용될 수 있는 패키지가 이제 정상화 […]

계속 읽기

Hello ggplot2

외근, 몸살에 시달리면서 준비한 발표자료로 3회 R meetup 발표를 했다. 금번 모임 주제는 시각화(visualization)였으며, ggplot2를 살펴보는 와중에 전에 링크드인 분석가가 했던 이야기 “"Visualization is more important than you think."가 계속 머리속에 맴돌았다. 데이터 분석에서 생각보다 중요한 것…. 시각화…   국내 R 사용자를 위해 R meetup을 하자고 처음 제안한 이후에, 생각해보니 2회만 제외하고 모두 발표를 했다. […]

계속 읽기

KoNLP 0.7 업데이트

최근에 KoNLP가 업데이트 되었으며, 업데이트 내용은 아래와 같다. Version 0.7 —————————————————————————— * new dictionary added which from Sejong projects * added example * Set "dontrun" on example code because Windows encoding problems. * Warning message may appear if system doesn’t have Hangul encoding ability(no warning on UTF-8). Version 0.0-9.3 —————————————————————————— * added user dictionary manage […]

계속 읽기

담양 전씨 전자족보 족보 수단 양식

요즘 아버지께서 족보 관련 문제로 골머리를 썩고 계셨는데, 바로 이것 때문이었다. 다른 종친회는 관련 문서의 전자 포맷도 배포하는 것으로 오늘 파악할 수 있었는데, 전자 족보 간행 경험이 없어서인지 어떤 곳에서도 담양 전씨 수단 양식을 찾을 수 없었다. 결국 아버지와 차를 몰고 종친회 사무소에 방문해 포맷을 복사해 올 수 있었다. 힘들게 얻었지만, 아마도 다른 분들이 족보 […]

계속 읽기

UseR! 2012 Abstract

UseR! 2012의 abstract submition deadline에 맞춰서 한글 Text Mining에 대한 내용 발표를 하기 위해 abstract를 넣었다. 사실 회사 차원에서는 RHive를 발표하기 위해 팀원분과 함께 작업을 했고, 만일 가게 된다면 내 나름대로 관심이 있는 분야도 겸사겸사 발표해 보려고 올렸다. 재수가 좋다면 떨리는 가슴을 안고 미국 테네시주로 향하게 될 것이고 아니면 마는 거고… RHive는 반드시 오럴로 채택이 […]

계속 읽기

세 번째 R meetup

  제 3회 Meetup을 아래와 같이 공지합니다. 일시 : 2012. 03. 22. 목요일 19:00~20:30 장소 : NexR 회의실 (강남역 2호선 부근: 서초구 서초동 1321-6 동아타워 4층 KT Cloudware) (http://me2.do/5RCp3h) 주제 : R의 한글화 및 R 그래픽스 발표자 : 신종화님 : ”Contributed Packages의 번역: Rcmdr을 중 심으로” 유충현님 : “사용자 정의 그래프 함수 만들기” 전희원님 : […]

계속 읽기

Presentation Skill

최근 7th ACC의 설문조사에서 발표자들 중에서 1등을 했다는 연락을 ZDnet에서 받아 기자분들이 보고서와 함께 방문을 했었다. 발표를 하면서 느낄 수 있었던 열의가 그대로 설문조사로 표출되는 개인적으로 참 하기 힘든 경험을 했었다. 데이터 분석, 데이터 과학자의 중요 덕목으로 Presentation Skill일 손꼽고, 작년부터 데이터 과학자로 일하면서 이 부분에 대해서 많은 고민을 해왔는데, 중요한 방점하나를 찍은게 아닌가 하는 […]

계속 읽기

도메인 전문가 혹은 머신러닝 전문가?

Strata 컨퍼런스에서 있었던 논쟁중에 하나로 위 제목과 같은 내용의 대화가 우리가 익히 알고 있는 사람들에 의해서 논의 되었는데, 그 결론이 참으로 기억해 둘만해서 올려본다.   the data science debate: domain expertise or machine learning?   debator들은 아래와 같다.   Drew Conway, Ph.D. Candidate at NYU, Data Scientist at IA Ventures  DJ Patil, Data Scientist in […]

계속 읽기

패턴인식 및 기계학습 겨울학교 참가 후기

원래 최근 들어서 머리가 굵어져서 그런지 어딜 참석해도 후기 같은걸 잘 안 쓰는데, 후기를 쓰고자 한다. 2012년 2월 23일 ~ 25일까지 서울대학교에서 있었던 패턴인식 및 기계학습 겨울학교 후기이다. 일단 올해 들어서 6회에 접어드는 겨울학교인데, 처음 참석하는 거라서 성격을 잘 모르고 왔구나 하는 느낌이 많이 들었다. 커리큘럼 자체가 일반적인 제목들이라서 안심하고 갔는데, 패턴인식 개론서에 나온 정도의 […]

계속 읽기

Machine Learning for Hacker

  Machine Learning for Hacker 컴퓨터 서적 전문 출판사에서 통계학을 넘어서 기계학습까지 넘보고 있구나. 물론 오라일리에서 나온 programming collective intelligence 가 선구자 적인 역할을 하긴 했지만 이제는 R언어로 케이스 스터디 책이 나왔다. 어제 출간이 되었던데 사파리에서 올라와 있어서 몇몇 챕터를 보고 바로 결재 처리를 해버렸다(pdf로 보기도 힘들어서…). 이런 데이터 분석 류의 책은 툴을 설명하기 보다는 […]

계속 읽기