The Metropolis-Hastings algorithm

The Metropolis-Hastings algorithm 이전 포스팅인 Rejection sampling 이나 Sampling-Importance-Resampling algorithm과 같이 특정 확률분포 함수로부터 샘플링을 추출해 확률값을 근사시킬 수 있는 알고리즘이다. 다만 마르코프 체인의 개념을 이용해 이전확률값을 기준으로 현재 확률값을 평가해 이 기준에 만족하는 경우 샘플을 수용하고 아닐 경우 과거 샘플을 다시 넣는 방식을 사용한다. 흡사 Rejection Sampling과 개념은 비슷하나 Rejection 샘플링의 경우 샘플을 버리는 […]

계속 읽기

책을 쓰고 있다.

올해 초 부터인가 그 동안 데이터 분석이나 시각화 그리고 R에 대해서 조금씩 블로그에 정리해 두었는데, 이들을 기반으로 책을 써볼까 하는 생각을 해봤다.  그러다가 서민구님이 이미 비슷한 생각으로 책을 쓰시는 것을 알게 된 후부터 크게 깨닫고 바로 집필에 들어갔다. 사실 이전에 번역을 해본적이 있었는데, 번역과는 다르게 집필은 자신이 의도한 바대로 책을 쓰고 마치는 시점에서 책을 출판할 […]

계속 읽기

패턴인식 겨울학교 2013

오늘 관련 발표자료를 받아 봤는데, 발표자도 작년과 크게 다르지 않고 발표 자료도 업데이트 되는 수준인거 같다. 그래도 새로운 발표자분들이 오셔서 약간 기대는 하고 있다. 예상과 다르게 패턴인식 겨울학교가 빨리 마감되었는데, 너무 많이 등록해서 오프라인 등록도 받지 않는다 한다. 그럼 거의 참석자들은 정해졌다고 볼 수 있는데, 참석자분들의 소속이 어디인지 궁금해서 살짝 시각화를 해봤다. 관련 기술에 대한 […]

계속 읽기

2013년을 맞이하며

최근 들어 이런 종류의 글을 써본적이 없는데, 결국 2012년 마지막 날을 맞이하며 이렇게 글을 써본다. 2012년은 개인적으로 사회생활 그리고 나와 다른 사람들에 대한 고민을 참 많이 했던 날들의 연속이었다.  군대생활 30명이 넘는 부하를 두고 사람에 대해서 고민했을 때와는 사뭇 다른 고민들이었고 이 고민 덕분에 변하지 않는 진리에 대한 탐구와 갈망이 더 커졌다는 것을 무시할 수 […]

계속 읽기

방송대 정보통계학과 20주년 기념 컨퍼런스 홍보

통계학을 공부하고 싶은 직장인들에게 우리나라에서는 거의 단 하나밖에 없는 선택처가 되는 방송대 정보통계학과에 대해서 알고 싶은 분들에게 좋은 기회가 될 듯 해서 올려본다.  데이터로 밥을 먹고 사는 분들은 통계라는 데이터의 언어를 배울 필요가 있다는 생각이 아직까지 확고한바, 방송대도 좋은 선택중에 하나라고 자신있게 말씀드릴 수 있다.       ps. 교수님 부탁 반 자의 반임…

계속 읽기

shiny를 통한 R 웹 프로그래밍

R을 가지고 웹 프로그래밍은 하는 방법은 이전부터 많이 시도되어 왔다. shiny 이전까지는 Rook이라는 프레임웍이 있었고, 나름 웹 프로그래밍 다운 코딩을 할 수 있는 환경을 가져다 주었지만 사실 R을 전적으로 웹 프로그래밍을 하는데 쓰기 보다는 플로팅한 결과를 효과적으로 보여주기 위한 목적이 많았는데, 그 목적에는 잘 부합하지 않았다. 한마디로 R로 모든 웹 프로그래밍을 하길 원하기 보다는 시각화나 […]

계속 읽기

2012년 통계학회 추계 학술대회 발표자료

금일 빅 데이터 특별 세션에서 발표한 자료를 공유한다. 개인적으로 발표자료를 복잡하지 않게 하고 말로 많은 이야기를 하는데, 역시 발표자료에는 별 내용이 없다. 통계학도 분들에게 컴퓨터 공학 공부의 필요성을 따갑게 말씀해 달라는 좌장 교수님의 요청에 100% 부응할 수 있었음에 만족하는 바이다.   통계학, 컴퓨터 공학 그리고 빅 데이터에서의 융합

계속 읽기

R 전문가가 되기 위한 1만 시간

사실 R학습이 어렵다고들 하는 분들이 많아서 얼마 전에 RA에서 제공한 슬라이드에서 한 장 발췌해서 올려본다. 말콤 글레드웰의 책인 ‘아웃라이어’에서 어떤 것을 성취하기 위한 조건은 환경과 더불어 절대적인 시간 투자가 있어야 된다고 언급하고 있다. 성취를 위한 적절한 환경, 그리고 1만 시간…. 아마도 우리가 뭔가를 성취하기 힘들다고 습관처럼 이야기 하는 건 성취를 위한 필요조건에 대해서 너무 과소평가하기 […]

계속 읽기

데이터사이언티스트를 말하다

        원문링크 : http://www.sciencetimes.co.kr/article.do?todo=view&atidx=0000064069   빅데이터 처리 플랫폼과 분석을 하는 ‘NexR’에서 데이터사이언티스로 일하고 있는 전희원 씨. 예전부터 포털과 솔루션 회사에서 컴퓨터 공학적 측면의 데이터를 다뤄왔다. 빅데이터 처리를 위해 이것저것 배우다 보니 언젠가부터 주변에서 빅데이터 분석가인 데이터사이언티스트라고 부르기 시작했다. 그를 만나 데이터사이언티스트에 대한 궁금증을 풀어봤다. 컴퓨터 공학적 능력은 기본 “사회생활을 시작하면서 데이터 관련 […]

계속 읽기

DBguide 인터뷰 – “플랫폼보다 데이터 분석부터 시작해보세요” –

“플랫폼보다 데이터 분석부터 시작해보세요”   데이터 사이언티스트 전희원 전희원 데이터 사이언티스트와 최근에 이슈가 되고 있는 빅데이터와 데이터 분석에 대한 이야기를 나눴다. 자발적인 공부가 오늘날 자신을 만들었다는 전희원 씨는 현재 방송통신대 통계학과 4학년에 재학 중이다. 전희원 씨는 인하대 공대를 나와 고려대에서 머신러닝과 데이터 마이닝으로 석사학위를 받았다. 다음소프트와 야후!코리아에서 근무하면서 기계학습 검색 랭킹, Spelling Suggestion같은 대용량 로그 […]

계속 읽기