마소 WEKA 연재 1,2,3

올해 7,8,9월에 마소에 기고한 Weka 기고문(잡지 원문)과 관련 소스코드를 모두 공개한다. Weka 1,2,3회  전체 다운 받기 Weka 3회 소스코드  다운 전에도 언급했지만 엄청난 오타가 존재하고 있는데, WECA가 모두 WEKA로 교정되지 않았음을 양해해 주기 바란다. 1,2,3회가 쭉 이런 오타를 가지고 나올 수 밖에 없었는데, 이 사실이 참 안타깝긴 하다. 데이터 마이닝 및 WEKA GUI를 알아보자 WEKA […]

계속 읽기

3주째 코드리뷰 중…

주수로만 3주째 코드 리뷰 중이다. diff로 4천 라인 가까운 코드라 좀 오래 걸릴거라 예상을 했지만, 이정도로 오래 걸릴 줄은 몰랐다. ㅠㅠ 그래도 diff 업데이트 하면서 점점 코드가 튼튼해 지는 것을 피부로 느낄 수 있어서 기분 좋기는 하지만, 내 코드를 누군가에게 보여주고 오류를 발견해 달라고 요청하고 그 오류 리포트를 받는게 과히 기분 좋지만은 않은게 사실이다.하지만 다음 […]

계속 읽기

읽는 즐거움….

이번 동원 예비군 훈련때 가지고 간 두 권의 책이 모두 미스터 노 세계문학 전집에 속해 있는 책들이다. 물론 훈련 틈틈히 다 읽었다.  사실 이 미스터 노 세계문학은 어떤 분들에게는 때에 따라 형편없는(?) 책 품질에 실망에 찬 호소를 당하기도 하지만 가장 가볍고 쉽게 펼쳐 볼 수 있는 책, 무엇보다 그 예전 쪽지 시험볼 때 쓴 재생용 […]

계속 읽기

여긴 블로그인데….

가끔 최근 내 삶이 과연 이 블로그 업데이트 빈도수 만큼이나 특별한 것이 없는지 자문해 보곤 한다. 1년 전만해도 블로그 업데이트 간격이 1주일이 넘어가면 뭔가 불안한 마음이 엄습해 왔으나, 지금은 이상하게도 그런 생각이 들지 않는다. 어찌 보면 블로그 글은 현재 내가 몸담고 있는 현실에서 이루지 못하거나 꿈을 꾸고 있는 어떤 것들에 대한 대리 만족 창구가 되었던 […]

계속 읽기

Probabilistic data-driven Development

내가 본 글에서는 ‘확률적 데이터 드리븐 개발(Probabilistic data-driven Development)’ 이라고 언급하고 있고 내가 에자일 개발방법론은 잘 모르지만 그가 쓴 글에서 이 방법이 궁극의 에자일 프로그램 개발 방법이라는 이야기까지 언급이 되어 있었다. Peter Norvic이라는 구글 리서치 디렉터가 만는 100라인밖도 안되는 Spell Checker 프로그램을 보면 과연 그 말이 허언이 아님을 알 수 있다. 대신 그가 프로그램과 함께 […]

계속 읽기

학습 알고리즘 선택 기준

일단 단일 알고리즘의 경우 SVM을 가장 선호한다. 물론 모델 빌드 후 바로 cross-validation 결과를 보면 정확도가 그리 좋지 않을 수도 있지만 SVM이 일반화 능력이 가장 좋다는 것은 이미 많은 논문에서 증명된 사실이다. 하지만 나는 대부분의 경우 하나의 분류기만을 사용하지 않는다. 아는 사람들만 아시겠지만 앙상블 학습(Ensemble Learning)이 성능이 좋다는 것은 공공연한 사실이다. Boosting 정도만 써줘도 대부분의 […]

계속 읽기

제가 좋은 기술을 가졌다구요? 하지만 여러분 덕분입니다.

3일동안 회사 메일을 들여다 보지 않다가 지금 들여다 보고 너무 기분 좋은 메일을 받아서 어쩔줄 모르며 메일 쓴다. 지난 4개월동안 한가지 프로젝트에 매달려서 많은 경험을 했다는 사실은 이미 블로그에 이야기 한지 오래다. 전혀 새로운 개발 환경과 프로세스에 매달리며 동시에 성과도 내야 하는 그런 프로젝트를 하면서 같이 일하는 분들에게 누가 되지 않도록 정말 많은 노력을 하고 […]

계속 읽기

검색어 오타에 대한 흥미롭고 재미있는 사실들

ydnkr에 기고한 블로그 글이 오늘 올라 왔다. 작성한지는 꽤 되었으나 스케줄상 오늘 올라오게 되었다. 검색어 오타에 대한 흥미롭고 재미있는 사실들 역시 이것도 과연 그럴것인가? 하는 의문 때문에 하게 된 작업이였다. 물론 사용자 데이터 분석을 통해 사실을 알게 되었으며 이를 알고리즘화 하여 플랫폼에 넣었고 아시아 및 미국 개발자 분들이 삼삼한 개념이라는 말씀까지 들었던 내용의 일부분이다. ydn에 […]

계속 읽기

토비의 새로운 책들

programming collective intelligence 로 잘 알려진 토비가 최근에 새로운 책 두 권을 냈다. 첫번째는 Programming the Semantic Web 그리고 두 번째 책은 Beautiful Data 이다. 읽고 있는 책과 개인적인 용무가 많아서 무턱대고 구입하지 않고 회사에서 지원하고 있는 Safari Book 에서 열나게 보고 있는 중이다. 시맨틱 웹책은 잠깐 훎어 본 결과 온톨로지 관련된 책임에 분명하고 데이터 […]

계속 읽기