고감자 – 페이지 21 – from __future_

첫번째 R meetup 스크린캐스트

작성일자 2011년 12월 21일 고감자님이 작성

2011.12.19일 R meetup 행사를 회사 카페에서 진행을 했었다. 약 20명 정도의 분들이 오셔서 아기자기 하게 모임을 가졌고, 첫번째 세션으로 cran.nexr.com 을 운영하면서 나온 아파치 로그를 분석하는 방법과 그 결과물을 공유 했었고, 나머지 15분 동안 KoNLP 패키지 소개를 했었다. LA R User group에서 했던 meetup 행사 동영상을 보면서 상당히 스크린캐스트가 재미 있다는 생각을 해보게 되서 직접 […]

계속 읽기

KoNLP 0.0-8.0

작성일자 2011년 12월 11일 고감자님이 작성

KoNLP 패키지 업데이트를 했다. 업데이트 내용은 아래와 같음. Version 0.0-8.0 (2011-12-09)—————————————————————————— * improved performance more than 100 times on functions which related with Hannanum Analyzer. * set -Xmx512m for Java VM. * Java sources are added. 자바 코드 최적화로 성능향상이 있었는데, Thread 기반에서는 정확한 기능 보장을 못하니 R에서 병렬 프로세싱으로 KoNLP 패키지 사용을 […]

계속 읽기

빅 데이터 쌓기 경쟁

작성일자 2011년 12월 10일 고감자님이 작성

최근 작금의 상황을 보자면 빅 데이터를 모아서 쌓아두는데 목적을 두는 기업들이 상당히 많다는 것을 자주 느끼곤 한다. 빅 데이터를 쌓아두면 뭔가 가치 있는 정보들이 나올거라는 미신같은것 때문에 너도 나도 빅 데이터 클러스터를 구성하는데 관심을 가지고 있는 듯 하다. 물론 빅 데이터에 가는 가장 명시적인 마일스톤이 빅 데이터 처리 플랫폼을 구축하는 것이고 어쩌면 이는 돈을 투자하면 […]

계속 읽기

대한민국 커뮤니티 데이 발표자료

작성일자 2011년 12월 04일 고감자님이 작성

오늘 하루를 마무리 하면서 이런 글을 쓰다니 참 감개무량할 뿐이다. 아직 할 일이 좀 남아 있어서 잠은 늦게 들거 같긴한데, 일단 약속했던 발표 자료를 공유하고자 한다. 대한민국 커뮤니티 데이 발표자로 참여를 했고, 제목을 그럴싸하게 지어놓아서 아마도 실실적인 첫번째 세션으로 선정된 듯 하다. 그 덕분에 오늘 스케줄을 참 나이스하게 마무리 하긴 했다. 발표가 끝나고 오후 1시부터 […]

계속 읽기

코드리뷰를 정말 잘 정착 시키고 싶다면…

작성일자 2011년 11월 29일 고감자님이 작성

다시금 예전에 열심히 코드리뷰 하던 생각을 하게끔 하던 일들이 생겨나면서 야밤에 여러 생각을 하게 만든다. 코드리뷰… 리뷰야 하면 좋은데, 시간은 없고…. 그렇다고 안할수도 없고…, 이런 생각으로 코드리뷰를 하게 되면 100% 얼마 안가서 그만두게 된다. 그럼 계속 잘 하게 하려면 어떻게 해야 하나? 그렇다면 일단 코드리뷰보다는 hudson과 같은 빌드 테스트 환경을 잘 갖추고, 소프트웨어 테스트를 굉장히 […]

계속 읽기

데이터 마이닝 강의 중에…

작성일자 2011년 11월 28일 고감자님이 작성

강의 중에 생각했던 비선형 함수 모델 피팅의 어려움, 혹은 한계? 선형 함수, 비선형 함수 등등 예측의 문제에서 가장 큰 두 카테고리가 아닐 수 없는데, 왜 선형 함수 적합이 더 선호되고 가장 일반화시킬 수 있는 접근 방법인지… 한번 보자. 강의안에 있던 sin 함수 예측 예제가 있는데, 그 예제를 좀더 변형해 봤다. install.packages("nnet") inp1 <- seq(0,12,0.01) out1 […]

계속 읽기

Korea R CRAN 미러링

작성일자 2011년 11월 25일 고감자님이 작성

최근 새로운 Korea R CRAN 미러링 서버가 올라왔다. 이 준비는, 넥스알 데이터 분석팀에서 했고, 웹 서버 세팅부터 운영까지 분석팀에서 하고 있다(뭐 정확하게는 내가 하고 있지만. ㅋ ). 서버 업데이트 주기는 하루 2번이며 미러링 status를 보면 대강 어느 시간이 업데이트 시간인지 알 수 있다. 하루 두번이면 상당한 주기여서 가장 최신의 패키지라도 빨리 받아볼 수 있다. […]

계속 읽기

R 한글 인코딩 문제 (KoNLP 작업 과정에서…)

작성일자 2011년 11월 11일 고감자님이 작성

처음 R CRAN에 등록하고 참 많은 것들을 해본거 같다. 가장 큰 문제였던 것들은 윈도우 머신에서 오동작 하는 문제와 json 포맷 파일을 윈도우에서 읽어 오지 못하는 문제였다. 일단 맥과 리눅스에서는 잘 돌아가는 것을 확인 했지만 결국 위 두 가지 문제를 해결하면서 맥과 윈도우도 UTF-8에서만 잘 도는 것이였음이 밝혀졌다. 일단 한글 처리 패키지이기 때문에 CJK관련 문자 인코딩에 […]

계속 읽기

KoNLP cran 등록 완료

작성일자 2011년 11월 09일 고감자님이 작성

일단 R cran에 등록 되었다는 메일을 받았다. 그리고 확인 해보니 정말 등록 되어 있었다. http://cran.r-project.org/web/packages/KoNLP/ 패키지 소개에서도 언급 했지만 오픈소스 형태소 분석기들이 없었다면 이런 작업이 쉽지는 않았을 것이다. R 패키지 처음 만들어 보고 게다가 Java언어와 인터페이싱에 신경 쓰느라 정작 직접 구현한 함수들의 내구도가 떨어지는데, 이는 추후 보완해야 될 작업이라고 생각한다.

계속 읽기

KoNLP submit 완료 그리고 기다림….

작성일자 2011년 11월 08일 고감자님이 작성

gogamza@ubuntu:~/prj$ R CMD roxygen -d KoNLP 요구된 패키지 digest를 로드중입니다 Writing doKoMorph to KoNLP/man/doKoMorph.Rd Writing extractNoun to KoNLP/man/extractNoun.Rd Writing MorphAnalyzer to KoNLP/man/MorphAnalyzer.Rd Writing SimplePos22 to KoNLP/man/SimplePos22.Rd Writing SimplePos09 to KoNLP/man/SimplePos09.Rd Writing is.hangul to KoNLP/man/is.hangul.Rd Writing convertHangulStringToJamos to KoNLP/man/convertHangulStringToJamos.Rd Writing convertHangulStringToKeyStrokes to KoNLP/man/convertHangulStringToKeyStrokes.Rd Writing makeTagList to KoNLP/man/makeTagList.Rd Writing KoNLP to KoNLP/man/KoNLP.Rd Writing DicConfPath to KoNLP/man/DicConfPath.Rd Writing […]

계속 읽기