ML에 입문하고자 하는 어떤 대학생분의 메일과 그 답변

아래 메일 내용은 주말에 어떤 학생분이 메일을 보내주신 것에 대한 답변 메일이다. 물론 이 메일 공개에 대해 사전에 동의를 얻은 상태다. 사실 이런 메일 내용에 대한 문의는 자주 있어 왔다. 하지만 이 메일이 가장 많은 내용을 포괄적으로 질문한 것이라 다른 궁금증을 가지고 있는 분들도 참고하면 좋을거 같다. ——————————————————————————————– 안녕하세요. 질문 잘 받았습니다. 1. 머신러닝 및 […]

계속 읽기

Lucene in Action 2nd

루씬 인 액션 2판 출간을 기다리는 중이다. 이 책의 저자중에 한명인 오티스가 자신의 블로그에 40% 할인 코드를 내걸었다. 그것도 이달 말까지 40% 할인이 적용되니 이 책에 관심이 있고 원서를 구매할 의향이 있으신 분들은 이 코드를 통해 구매할는 것도 나쁘지 않을거 같다. code : lucene40 새롭게 버전업된 루씬에서 지원하는 다양한 검색 기능에 대해서 어떻게 구현이 되었는지 […]

계속 읽기

Discounted Cumulative Gain

DCG라는 metric은 기존의 precision, recall 기반의 검색엔진 평가 방법으로는 순위에 따른 차별점을 부과하기 힘들다는 판단에 따라 나온 방법이다. 이전에도 언급했지만 50% 이상의 검색 사용자가 검색 결과의 1,2 페이지 정도만 참고한다는 것은 precision, recall 만으로는 정확한 사용자 패턴에 기반한 성능평가를 하기 힘들다는 것을 알 수 있다. Cumulative Gain 이는 그냥 n개의 검색 결과의 등급을 모두 합한 […]

계속 읽기

대만 출장을 마치고.

대만 야후 오피스 내부 장식물 이번 출장 역시 나에게 많은 것을 느끼게 해주었다. 전에 블로그에 쓴 것 말고도 많은 숙제와 가능성을 남겨줬다. 실제 출장을 가기 전에 처음 만나는 사람들에게 무엇을 보여줄지 많은 고민을 했다. 영어? 물론 영어 실력이야 평소에 습관이 되었을 정도로 꾸준히 했지만 갑자기 준비한다고 장족의 발전이 되는 것도 아니고 하니 다른 것에 집중한게 […]

계속 읽기

Speak english all day long

이번 출장의 가장 큰 일정인 종일 미팅을 무사히 마쳤다. 물론 내일 미팅이 하나 남았지만 크게 부담은 되지 않는다. 홍콩영어, 대만영어 등등 하루종일 다양한 종류의 영어를 접했다. 그리고 하루종일 영어로 이야기만 했던건 태어나서 처음이였다. 전에 누군가가 이야기 했었지만 다른 사람이 이야기 하는걸 정확히 이해하는게 내 생각을 정확하게 표현하는 것보다 힘들다는것을 다시한번 느꼈다. 홍콩에서 오신분의 영어는 정말 […]

계속 읽기

출장 갑니다.

대만으로 출장간다. 대만으로 가는 항공기 기다리다가 옆에 네이버 스퀘어에서 제공하는 무선인터넷으로 인터넷 해봤다. 맥북 웹캠으로 살짝 네이버 스퀘어를 찍어 봤는데 잘 안나오네..(요놈은 인물사진용인가 보다. ) 초행길이고 동행자/배웅해오는 사람도 없는지라 조금 헤맬거 같다는 느낌이 들지만 오늘은 조금 여유가 있으니 호텔까지만 잘 찾아가면 된다. ㅋ 유익한 출장이 되리라 믿는다. ^^

계속 읽기

Ubiquity 야후 사전 검색 플러그인

Ubiquity 플러그인을 아주 편하게 쓰다가 필요한게 있어서 만들어 봤다. ^^; Ubiquity가 무엇인지는 이 분의 블로그 글을 참고하면 도움이 될 것이다.  맥 OS를 쓰시는 분은 잘 아시겠지만, 이 플러그인은 FF에서 쓸 수 있는  QuickSilver라고 생각하면 된다. 요즘 맥북을 주로 쓰고 있는데, 사전 쓸만한걸 찾을 수 없어서 울며 겨자 먹기로 야후 웹 사전을 좀더 편하게 쓸 수 […]

계속 읽기

k-means, EM 알고리즘… 그리고 알맞은 k개수

어제 번역을 하면서 오랜만에 duda의 pattern classification책을 펼쳐 봤다. 워낙에 이 바닥에서는 알아주는 책이지만 사실 이 책 통독은 하지 못했다. 하지만  필요한 부분을 찾아보는 용도로 주로 쓴다.  ^^; 어제는 EM 알고리즘을 오랜만에 살펴봤다. 내가 아는 EM 알고리즘은 기본적으로 미지의 분포 파라메터를 주어진 데이터를 가지고 예측을 하고 그 예측값을 다시 주어진 데이터를 기반으로 기대치를 최대화 시키는 […]

계속 읽기

맥북이 생겼다.

회사 노트북을 새로 받았다.물론 맥북을 신청 했었다. ㅋㅋㅋ 오늘 받았는데, 새로운 OS라서 그런지 상당히 재미있다. 한가지 단점이라면 ms word에서 전혀 한글 맞춤법 검사가 안된다는 것이다. 이렇게 되면 아래한글을 써야 하나? 여튼 이 부분이 현재로서는 가장 불편하다. 이것 말고 이미 회사 IT팀에서 vmware 윈도우  image까지 깔아주고 ms 오피스로 깔려 나와서 큰 불편은 없는 상황이다. 맥북 라이프가 […]

계속 읽기

Collective Intelligence In Action 저자 Satnam Alag의 인터뷰

readwriteweb에 최근 번역중인 Collective Intelligence in Action 의 저자와 추천엔진(recommendation engine)에 대한 인터뷰가 실렸다. 이 글을 보면 저자가 추천엔진의 정확도 측면보다 이를 애플리케이션에 적용할 때 대용량 데이터와 수많은 사용자의 요구를 빠르게 충족시켜 줄 수 있으냐를 고민하고 있음을 알 수 있었다. 그래서 구글 뉴스의 추천엔진이 가장 인상깊은 추천 시스템이라고 말하고 있고 Netflix 추천 시스템 10% 향상 […]

계속 읽기