오늘 리뷰 끝난다.
번역본을 보려 기다리다가 지쳐서 결국 원서를 보고 있는 우리 아들.. 이래저래 볼일이 있어서 오늘 휴가를 내었는데, 겸사겸사 번역 리뷰를 끝내고자 한다. 그동안 시간 내기가 힘들긴 했나 보다. 여튼 오늘 끝난다.
계속 읽기당신의 나의 뜨거운 감자!
번역본을 보려 기다리다가 지쳐서 결국 원서를 보고 있는 우리 아들.. 이래저래 볼일이 있어서 오늘 휴가를 내었는데, 겸사겸사 번역 리뷰를 끝내고자 한다. 그동안 시간 내기가 힘들긴 했나 보다. 여튼 오늘 끝난다.
계속 읽기빡빡한 일정 덕분에 굉장히 힘든 출장이였다. 게다가 모국어도 아닌지라 언어적인 스트레스까지 겹쳐 꽤 힘들었다. 사실 training이 주 목적이였지만 그보다도 지금까지 코딩했던 코드 함께 리뷰하고 그리고 모델 빌드한거 회의시간에 디버깅 하고 이게 제일 많았던거 같다. 잘 되지 않은 영어 실력으로 외국인들에게 알고리즘 설명하고 쩝…. 그나마 칠판에 써가면서 할 수 있다는게 참 좋았다. 이걸 영어로 모두 설명 […]
계속 읽기최근 한글 처리를 주로 하게 되서 처음으로 한글 관련 논문을 봤다. 임교수님 밑에서 수학을 했지만 한글 처리보다는 검색과 스팸관련해서만 공부해온 터라.. 이쪽으로 상당히 문외한 이다. 이 논문을 보고 오늘 본사에서 k-phone에 대해서 잠깐 회의 시간에 설명을 해줬다. 게다가 이것을 우리 모듈의 어느 곳에 사용하면 되는지 까지.. PM 분 등이 꽤 긍정적인 반응을 보였다. 이미 한국에서 […]
계속 읽기크게 보기 2년 전에 처음 미국에 갔을 때보다는 좀 담담하다… 한번 가본곳이라 더 그런가??? 여튼..
계속 읽기올해 7,8,9월에 마소에 기고한 Weka 기고문(잡지 원문)과 관련 소스코드를 모두 공개한다. Weka 1,2,3회 전체 다운 받기 Weka 3회 소스코드 다운 전에도 언급했지만 엄청난 오타가 존재하고 있는데, WECA가 모두 WEKA로 교정되지 않았음을 양해해 주기 바란다. 1,2,3회가 쭉 이런 오타를 가지고 나올 수 밖에 없었는데, 이 사실이 참 안타깝긴 하다. 데이터 마이닝 및 WEKA GUI를 알아보자 WEKA […]
계속 읽기주수로만 3주째 코드 리뷰 중이다. diff로 4천 라인 가까운 코드라 좀 오래 걸릴거라 예상을 했지만, 이정도로 오래 걸릴 줄은 몰랐다. ㅠㅠ 그래도 diff 업데이트 하면서 점점 코드가 튼튼해 지는 것을 피부로 느낄 수 있어서 기분 좋기는 하지만, 내 코드를 누군가에게 보여주고 오류를 발견해 달라고 요청하고 그 오류 리포트를 받는게 과히 기분 좋지만은 않은게 사실이다.하지만 다음 […]
계속 읽기가끔 최근 내 삶이 과연 이 블로그 업데이트 빈도수 만큼이나 특별한 것이 없는지 자문해 보곤 한다. 1년 전만해도 블로그 업데이트 간격이 1주일이 넘어가면 뭔가 불안한 마음이 엄습해 왔으나, 지금은 이상하게도 그런 생각이 들지 않는다. 어찌 보면 블로그 글은 현재 내가 몸담고 있는 현실에서 이루지 못하거나 꿈을 꾸고 있는 어떤 것들에 대한 대리 만족 창구가 되었던 […]
계속 읽기내가 본 글에서는 ‘확률적 데이터 드리븐 개발(Probabilistic data-driven Development)’ 이라고 언급하고 있고 내가 에자일 개발방법론은 잘 모르지만 그가 쓴 글에서 이 방법이 궁극의 에자일 프로그램 개발 방법이라는 이야기까지 언급이 되어 있었다. Peter Norvic이라는 구글 리서치 디렉터가 만는 100라인밖도 안되는 Spell Checker 프로그램을 보면 과연 그 말이 허언이 아님을 알 수 있다. 대신 그가 프로그램과 함께 […]
계속 읽기일단 단일 알고리즘의 경우 SVM을 가장 선호한다. 물론 모델 빌드 후 바로 cross-validation 결과를 보면 정확도가 그리 좋지 않을 수도 있지만 SVM이 일반화 능력이 가장 좋다는 것은 이미 많은 논문에서 증명된 사실이다. 하지만 나는 대부분의 경우 하나의 분류기만을 사용하지 않는다. 아는 사람들만 아시겠지만 앙상블 학습(Ensemble Learning)이 성능이 좋다는 것은 공공연한 사실이다. Boosting 정도만 써줘도 대부분의 […]
계속 읽기