내가 가장 좋아하는 컵
내가 세상에서 가장 좋아하는 머그컵이 있다. 바로 예전에 샌프란시스코 출장을 갔을때 와이프것과 내것으로 커플로 맞춰온 머그컵이다. 회사 카페에서 커피를 받을때 일회용을 사용하지 않고 굳이 이 컵을 씻어서 매번 사용하는 이유가 있는데…바로 이 컵으로 뭔가를 마시면 잠시 여행을 다녀올 수 있기 때문이다. 컵의 전면에 샌프란시스코의 명물들이 그려져 있는데, 커피를 받아서 이 그림들을 보고 있자면 그곳의 좋은 […]
계속 읽기당신의 나의 뜨거운 감자!
내가 세상에서 가장 좋아하는 머그컵이 있다. 바로 예전에 샌프란시스코 출장을 갔을때 와이프것과 내것으로 커플로 맞춰온 머그컵이다. 회사 카페에서 커피를 받을때 일회용을 사용하지 않고 굳이 이 컵을 씻어서 매번 사용하는 이유가 있는데…바로 이 컵으로 뭔가를 마시면 잠시 여행을 다녀올 수 있기 때문이다. 컵의 전면에 샌프란시스코의 명물들이 그려져 있는데, 커피를 받아서 이 그림들을 보고 있자면 그곳의 좋은 […]
계속 읽기이 앙상블 러닝 방법은 이전의 포스팅에서도 소개를 한적이 있었다. 이 앙상블 방법에 대해서 상당히 잘 설명한 발표자료를 소개한다. 역시 이런것은 예제를 어떤걸로 제시하느냐가 이해도를 높이는 가장 중요한 방법중에 하나라는 생각이 든다. 여기서 netflix prize를 풀기위한 방법에 따른 개선정도를 표시한 그래프가 있는데 대부분 존재하는 방법으로는 다 시도를 해본거 같다. 그래서 아마도 이 ppt의 저자는 이 방법들을 […]
계속 읽기회사서 웹검색을 하고 있는 관계로 대학원 생활동안 웹마이닝에 대한 공부 욕구가 컷으나, 개설이 한번도 된적이 없어 입맛만 다시고 있었다. 그러다… 이번 학기에 웹 데이터 마이닝 과목이 개설 되었다는 이야기를 듣고 정말 갈까 말까 고민하다가 청강을 하러 학교에 갔다.사실… 졸업한 몸이니 청강이라고 하기엔 좀 그렇다. ㅋㅋ 그런데 Springer책들은 왤케 쉽게들 나오는지… 텍스트북이 Web Data Mining 인데 […]
계속 읽기Hadoop이 느리다는 글을 우리 와이프님이 보시고 기정 사실로 받아 들이려고 하는걸 아래 테스트로 무마하고자 한다. 그럼 근거를 제시해 보도록 하겠다. 전에 netflix 데이터를 돌려본다는 포스팅을 쓴적이 있다. 그곳에서 제공해준 10억건이 넘는 데이터가 아래와 같은 포멧으로 있다. movieid(key), <rating, date, userid>,<rating, date, userid>, <rating, date, userid>, …….. 이것을 아래와 같은 유저 아이디를 키로 하는 데이터를 만드는 […]
계속 읽기Collective Intelligence 라는 책이 나온지 약 6개월이 넘어가고 있는데, 이와 비슷한 책이 또 나올 생각인가 보다. 뒤에 in Action을 넣어서 Collective Intelligence in Action으로 말이다. 이 책은 자바 기반으로 설명을 하고 있고, 여러 오픈소스 프로젝트들을 이용하고 있다. Lucene, JDM(Java Data Mining)과 WEKA라는 마이닝 툴킷까지… 이건 이전의 책과는 달리 툴을 사용하는 방법 등에 대해서 주로 설명을 […]
계속 읽기netflix prize라는 해당 사용자가 보지 않은 영화의 점수를 예측하는 시스템을 만드는 대회이다. 상금이 무려 100만달러에 육박한다…@.@ 이것을 접하게된 계기는 hadoop mapreduce를 이용한 canopy clustering에 대한 자료를 찾다가 이 숙제 데이터셋을 보고 알게 되었다. netflix prize사이트에 가면 많은 설명이 되어 있고, 이 블로그에 가면 쉽게 정리된 자료를 볼 수 있다. 아무래도 서비스를 위한 빠른 알고리즘을 원하기 […]
계속 읽기제목의 글을 읽고 나름의 생각들… 회사는 자신의 능력을 향상시키기 위해서 일을 주는건 아니다. 물론 회사의 도전적인 일을 맡음으로서 그런 일이 가능할지는 모르겠지만, 대부분 이사람이 하던일, 잘 하는일을 부여한다. 따라서 자신의 복수의 칼을 갈려면 회사와 일을 탓해서는 안되고 자신이 관심있고 추후 ‘칼’로 쓰일 기술 분야에 대해 자신의 시간을 할애해서 공부해야 한다는 것이다. 내 주변에 새벽에 가족들이 […]
계속 읽기예전에 이마트 책코너에 가면 일반 서점에 비해서 별 다를게 없고 게다가 서점보다 다양하지 않아 그리 찾지 않았었다. 그러다 올 설 연휴때 고향에 내려가 이마트에 가서 깜짝 놀랐다. 여타 시중의 서점에서는 팔지 않는 미니북을 팔기 때문이다.대부분의 미니북이 고전위주로 이루어져 있는 일반 서점에 비해 가장 많이 읽힌 최근의 베스트셀러 위주로 미니북이 구성되어 있었다.그래서 이번에 이마트를 방문하고 아래와 […]
계속 읽기Hadoop이 야후 검색의 심장역할을 하게된다. 뭐 사내에서는 오래전부터 진행이 되어 왔던 일이고, 이런 오픈 플랫폼 지원에 대해서 대대적으로 홍보를 하고 있는바 쓰지 않을수가 없다. 이미 대세는 대용량 처리의 시대가 되고 있고, 야후는 오래전부터 이런부분에 대해서 준비하며 앞으로 가장 많이 쓰일 상업용 어플리케이션의 오픈소스화를 성공시켰다. 아마도 이런 정보처리 부분에 대해서 리딩 그룹으로 야후가 앞장을 설 것이라 […]
계속 읽기