두 변수의 관계 분석

요런 본격적인 데이터 분석 방법소개는 처음인데…종종 “데이터분석”카테고리에 글을 정리하고자 한다. 개인적으로는 R언어를 데이터분석에 활용하는것에 대한 정리 차원의 의미가 크다고 말하고 싶다.   EDA에서는 크게 네가지 주제를 다루게 된다. 1. resistance의 강조 2. residuals의 계산 3. 자료변수의 re-expression 4. 그래프를 이용한 revelation 아래 예제는 이 네가지를 이용한 간단한 분석을 소개한다. 먼저 데이터가 resistance를 가지게 하기 위해서 […]

계속 읽기

R언어 GUI 환경 R commander

R을 써본 사람은 아시겠지만 R은 거의 shell환경에서 커멘드라인을 통해 작업을 할 수 밖에 없는 기본 환경을 제공하는데 그런 사용상 사용자에 친숙하지 않은 환경을 보완하기 위해 R commander가 나오게 되었다. 물론 R commander 역시 R을 처음 접할때부터 사용하면 이 역시 만족할만한 환경이 아님을 알 수 있으나,  처음부터 R 커멘드라인을 사용해온 사람이라면 이정도의 환경이라도 얼마나 편한지 잘 […]

계속 읽기

Code Freeze 폭풍 전야에 R 도서 리뷰나..

오늘 원래 회사 4시에 퇴근 할 수 있는 날인데, 지금 새로 작성된 코드들 디버깅과 실제 런타임 테스트를 하고 있다. 한 2시간 전까지만 해도 심각한 버그를 가지고 있어서 금방 프로세스가 assert문으로 죽어 버리곤 했는데, 원인을 발견해 고쳐서 현재 열심히 테스트 모델 빌드중에 있다. 아마도 이번 빌드 마지막 코드 체크인은 내일 아침 그러니까, 미국 시간으로 오후 늦게나 […]

계속 읽기

R언어를 경험하다.

최근 R언어를 사용해 논문 통계 데이터를 핸들링 하고 있다. 사실 익숙해 지니 여타 다른 엑셀과 같은 툴이 부럽지 않은 장점이 있다. SAS, SPSS는 비싸고 그렇다고 해적판을 깔아서 쓰기도 좀 그런 단점이 있다. 그렇다고 엑셀을 사용하자니 데이터의 통계를 내기 위한 단순한 함수 적용을 함으로써 약간 답답한 면이 있고, 그렇게 많지 않은 함수만을 제공하고 있어서 사용하기 좀 […]

계속 읽기