3D 프린터와 이변량 정규분포

3D 프린터 라즈베리파이 기반 회로질의 가장 어려운점은 케이싱을 하는게 매우 어렵다는 것이다. 그래서 다이소 같은 곳에 가서 여성분들 잡동사니 넣어두는 아크릴 상자를 만든 회로의 케이스로 쓰던지 혹은 초등학생 필통에 구멍을 뚫어서 만들곤 했다. 아크릴 상자의 경우 적당한 구멍을 뚫기 위해 시도를 하다가 상자가 깨지는 경우가 99%였고, 초딩 필통도 종이 필통이 아니면 엄두도 나지 않는 작업이었다. […]

계속 읽기

엔터프라이즈 환경에서 R Local Repository 구축하기

엔터프라이즈 환경에서 R을 기반으로 분석 환경을 구축할때 가장 문제가 되는 점이 CRAN을 폐쇄된 내부 환경에서 어떻게 접근하느냐 이다. 물론 CRAN접속 없이 소스파일만으로도 설치가 가능하지만 대부분의 유명 패키지의 경우 다른 패키지와 의존관계를 보이고 있고 그러한 의존관계를 가지고 있는 패키지들이 타 패키지들과 의존관계를 가지고 있는 경우가 많아 CRAN없이 하나의 패키지를 설치하기 위해서 많은 불편함이 존재하고 있다. 필자의 […]

계속 읽기

Boosting Tree를 이용한 특징 추출

Tree기반의 Boosting 알고리즘을 일반적으로 GBDT라고 이야기한다. 사실 필자가 Boosting기법을 실무에 직접 활용한건 약 9년전 Yahoo!에서 였는데, 당시 지금 모델링하는 방식과는 다른 무식한 방법으로 모델링하고 적용하기를 반복하면서 깊이있는 활용과 이해는 하지 못했던 아쉬움이 있었다. 하지만 다시 그 진가를 확인하고 있는 순간이 왔고 모델링 뿐만 아니라 속성 추출에도 활용 가능한 팔방미인이라는 것을 최근에 알게 되면서 다소 방법론 […]

계속 읽기

인정받는 데이터 분석가 되기 – 외부 세미나 요약 –

얼마 전에 발표했던 외부 세미나 자료 요약을 공유한다. 발표자료에 워낙 내용이 없어서 핵심 내용 중심으로 간단한 코멘트를 해본다. 이날 발표제목은 “인정받는 데이터 분석가 되기”였다. 다소 자극적인 제목이나 실제 실무를 해보면서 느꼈던 부분에 기반해서 정리한 내용이라 이런 부분에 대해서 평소 고민했었던 분들에게는 정말 필요하고 힐링되는 내용이였으리라 생각한다. 필자에 대해 다른 분들은데이터 사이언티스트라 부르곤 하며,  자칭 데이터 분석가로 […]

계속 읽기

정확한 처리 효과 분석을 위한 성향점수분석(PSA)

비교는 비교할 대상과 비교해야 된다. 흔히들 적절한 비교 대상을 정해주지 않고 자신이 보고 싶은 효과만 비교하는 경우를 많이 본다. 이미 다른 성격을 가진 과일 두가지를 비교해 뭔가 유의미한 특징을 발견했다고 해서 대단한 발견이라고 하기 어려운 것과 마찬가지이다. 사과, 오렌지라는 사실 자체에 효과가 포함되어 있을 가능성이 굉장히 높으며 이는 특정 실험효과로 인한 결과라 보기 어렵다. 예를 […]

계속 읽기

전세가율 시각화 분석

전세가율이 높아지고 있다고 많은 미디어에서 이야기 하고 있다. 따라서 실제 전세가율이 시간이 지나면서 어떻게 변해가는지 데이터를 통해서 확인해 보고자 한다. 이를 위해서는 국토교통부 실거래가사이트에서 전세/매매 관련 데이터를 가져와야 되는데 크롤링 하는 방법은 필자가 정리해둔 국토교통부 실거래가 데이터 크롤링 코드를 참고해서 수집하면 된다. suppressPackageStartupMessages({ library(data.table) library(dplyr) library(ggplot2) library(lubridate) library(extrafont) library(stringr) }) theme_set(theme_gray(base_family = "UnBatang")) #전세/매매 데이터 […]

계속 읽기

회사 사보 인터뷰

오랜만에 블로그 워드프레스 웹 에디터로 글을 써본다. 얼마전에 회사 사보에서 인터뷰를 했는데(처음엔 그룹 사보인줄 알았다), 관련 글을 올려도 큰 문제 없다는 이야기를 듣고 이렇게 인터뷰 글을 올려본다(백업용이다 ^^). STK 마켓탑 회사 내에서는 마켓탑이라는 호칭으로 한 석달전에 전사 세미나를 하고 그걸 녹화한 방송이 몇일 후 전사 방송으로 송출되는 사건이 있었는데, 아마도 이 인터뷰 글이 그 여파의 […]

계속 읽기

비선형 모형과 추세 분석(아파트 매매 데이터 기반)

지난번 포스팅을 통해서 얻은 데이터와 그 이전 포스팅의 아파트 매매가에 미치는 층수, 크기, 년도 효과에 대한 분석의 후속 분석으로 같은 데이터를 기반을 하는 분석이지만 2015년 Q1의 데이터가 어느정도 모였으니 이의 가격동향과 더불어 다중 회귀모형의 비선형적인 효과를 좀더 다른 방식의 알고리즘으로 모델링 해보고 시각화 해보는 과정을 거쳐보도록 하겠다. 참고로, 분석을 위해 2015년 2월까지의 아파트 매매 데이터를 […]

계속 읽기