개발

고감자 on 11월 29th, 2011

다시금 예전에 열심히 코드리뷰 하던 생각을 하게끔 하던 일들이 생겨나면서 야밤에 여러 생각을 하게 만든다. 코드리뷰… 리뷰야 하면 좋은데, 시간은 없고…. 그렇다고 안할수도 없고…, 이런 생각으로 코드리뷰를 하게 되면 100% 얼마 안가서 그만두게 된다. 그럼 계속 잘 하게 하려면 어떻게 해야 하나? 그렇다면 일단 코드리뷰보다는 hudson과 같은 빌드 테스트 환경을 잘 갖추고, 소프트웨어 테스트를 굉장히 [...]

Continue reading about 코드리뷰를 정말 잘 정착 시키고 싶다면…

고감자 on 11월 11th, 2011

처음 R CRAN에 등록하고 참 많은 것들을 해본거 같다. 가장 큰 문제였던 것들은 윈도우 머신에서 오동작 하는 문제와 json 포맷 파일을 윈도우에서 읽어 오지 못하는 문제였다. 일단 맥과 리눅스에서는 잘 돌아가는 것을 확인 했지만 결국 위 두 가지 문제를 해결하면서 맥과 윈도우도 UTF-8에서만 잘 도는 것이였음이 밝혀졌다. 일단 한글 처리 패키지이기 때문에 CJK관련 문자 인코딩에 [...]

Continue reading about R 한글 인코딩 문제 (KoNLP 작업 과정에서…)

고감자 on 11월 9th, 2011

일단 R cran에 등록 되었다는 메일을 받았다. 그리고 확인 해보니 정말 등록 되어 있었다. http://cran.r-project.org/web/packages/KoNLP/     패키지 소개에서도 언급 했지만 오픈소스 형태소 분석기들이 없었다면 이런 작업이 쉽지는 않았을 것이다. R 패키지 처음 만들어 보고 게다가 Java언어와 인터페이싱에 신경 쓰느라 정작 직접 구현한 함수들의 내구도가 떨어지는데, 이는 추후 보완해야 될 작업이라고 생각한다.

Continue reading about KoNLP cran 등록 완료

지난달에 휴가 내면서까지 원고 데드라인을 맞췄던 ‘R로 하는 Big Data 분석’ 2회 연재를 월간 마소8월호 출간에 맞춰서 공개한다. 1회는 기말고사에 좀 집중하려고 팀원분에게 부탁을 드려서 잘 해결 되었으나 2회는 역시 kmobile 강연하고 거의 겹치는 바람에 집중을 못하고 있다가 결국 휴가내고 하루 집중해서 해결 했다. doSMP와 Rmpi, 그리고 snowfall이라는 멀티코어 분산처리 패키지를 중심으로 설명을 했고, 인터넷에도 [...]

Continue reading about 월간 마소 연재) R로 하는 멀티코어 병렬프로그래밍

고감자 on 2월 9th, 2011

아래 글은 책(“Natural Language Processing with Python” )의 예제에 알파벳 bigram feature를 추가해서 실험 한 결과이다. (이 부분에 대한 명시 없이 글을 써놓고 있다가 댓글에서 지적을 받아 수정했다. 코드예제 책을 보며 작성하고 시간이 많이 흐른 뒤에 해당 코드를 사용해서 포스팅을 하다보니 본의아니게 큰 실수를 하고 말았다. 나중에라도 이런 명시가 없어서 벌어질 사태를 생각하면 지적해준 분에게 [...]

Continue reading about 이름만으로 성별 구분