RSS 주소를 바꾸고자 합니다.

이전까지 feedwave 주소를 가져다 썼는데, 이 feedwave가 종종 먹통이 되는 바람에 이번기회에 rss주소를 바꿔보자 한다. (오늘 먹통이다. 얼마전 먹통될때와 비슷한 증상으로 보인다.) 이것도 핸드폰 번호 바꾸는것만큼이나 구독하는 분들의 수많은 수고를 일으키는 일이라 많이 망설였지만 더 나은 구독자분들의 편의를 위해 과감히 시행해 본다.물론 당장 feedwave 구독 주소를 없애는건 아니지만, 현재 hanrss에서 “!” 표시를 보신분이거나 별도의 불편함을 […]

계속 읽기

서재가 생겼습니다.

그동안 원룸에서 생활하다가 이사한 후에 내 서재가 생겼다. 저녁늦게 와이프 자고있는 동안 책보거나 작업하는데 미안하기도 했던터라 이렇게 서재가 생긴것을 개인적으로 상당히 다행으로 생각하고 있다. 책이 좀 있는데, 이것도 작은 책장 크기만한 만큼의 책을 버리고 이사를 해서 이정도다.물론 이사할때 버릴 책들의 필터링은 최근 1~2년 사이에 열어보지 않은 책들 위주로 선정했고, 40권 정도의 책을 처분한거 같다. 책을 […]

계속 읽기

내가 가장 좋아하는 컵

내가 세상에서 가장 좋아하는 머그컵이 있다. 바로 예전에 샌프란시스코 출장을 갔을때 와이프것과 내것으로 커플로 맞춰온 머그컵이다. 회사 카페에서 커피를 받을때 일회용을 사용하지 않고 굳이 이 컵을 씻어서 매번 사용하는 이유가 있는데…바로 이 컵으로 뭔가를 마시면 잠시 여행을 다녀올 수 있기 때문이다. 컵의 전면에 샌프란시스코의 명물들이 그려져 있는데, 커피를 받아서 이 그림들을 보고 있자면 그곳의 좋은 […]

계속 읽기

요즘 관심사.

1. 이사(moving home)2. Wrapper Learning3. C++ Boost$. netflix prize 토요일날 이사를 완료하고 현재 집정리 중이다. TV하고 냉장고, 몇몇 가구등을 구입했고, 잘 정리되어 있다. 가장 관심이 갔던건 TV인데, 이 TV를 하이얼(47인치 Full HD)것으로 구입했다. 사실 TV 보는걸 좋아하지 않고 많이 쓰지도 않을거란 생각으로 처제에게 부탁해서 선물 받았는데, 예상외로 퀄리티가 너무 좋다.아직 Full HD 방송이 송출되지 않는 […]

계속 읽기

앙상블 러닝에 대한 좋은 발표자료

이 앙상블 러닝 방법은 이전의 포스팅에서도 소개를 한적이 있었다. 이 앙상블 방법에 대해서 상당히 잘 설명한 발표자료를 소개한다. 역시 이런것은 예제를 어떤걸로 제시하느냐가 이해도를 높이는 가장 중요한 방법중에 하나라는 생각이 든다. 여기서 netflix prize를 풀기위한 방법에 따른 개선정도를 표시한 그래프가 있는데 대부분 존재하는 방법으로는 다 시도를 해본거 같다. 그래서 아마도 이 ppt의 저자는 이 방법들을 […]

계속 읽기

Web Data Mining 강의

회사서 웹검색을 하고 있는 관계로 대학원 생활동안 웹마이닝에 대한 공부 욕구가 컷으나, 개설이 한번도 된적이 없어 입맛만 다시고 있었다. 그러다… 이번 학기에 웹 데이터 마이닝 과목이 개설 되었다는 이야기를 듣고 정말 갈까 말까 고민하다가 청강을 하러 학교에 갔다.사실… 졸업한 몸이니 청강이라고 하기엔 좀 그렇다. ㅋㅋ 그런데 Springer책들은 왤케 쉽게들 나오는지… 텍스트북이 Web Data Mining  인데 […]

계속 읽기

Hadoop 성능 측정

 Hadoop이 느리다는 글을 우리 와이프님이 보시고 기정 사실로 받아 들이려고 하는걸 아래 테스트로 무마하고자 한다. 그럼 근거를 제시해 보도록 하겠다. 전에 netflix 데이터를 돌려본다는 포스팅을 쓴적이 있다. 그곳에서 제공해준 10억건이 넘는 데이터가 아래와 같은 포멧으로 있다. movieid(key), <rating, date, userid>,<rating, date, userid>, <rating, date, userid>, …….. 이것을 아래와 같은 유저 아이디를 키로 하는 데이터를 만드는 […]

계속 읽기

collective intelligence in Action

Collective Intelligence 라는 책이 나온지 약 6개월이 넘어가고 있는데, 이와 비슷한 책이 또 나올 생각인가 보다. 뒤에 in Action을 넣어서 Collective Intelligence in Action으로 말이다. 이 책은 자바 기반으로 설명을 하고 있고, 여러 오픈소스 프로젝트들을 이용하고 있다. Lucene, JDM(Java Data Mining)과 WEKA라는 마이닝 툴킷까지… 이건 이전의 책과는 달리 툴을 사용하는 방법 등에 대해서 주로 설명을 […]

계속 읽기

netflix prize에 도전하고 있습니다.

netflix prize라는 해당 사용자가 보지 않은 영화의 점수를 예측하는 시스템을 만드는 대회이다. 상금이 무려 100만달러에 육박한다…@.@ 이것을 접하게된 계기는 hadoop mapreduce를 이용한 canopy clustering에 대한 자료를 찾다가 이 숙제 데이터셋을 보고 알게 되었다. netflix prize사이트에 가면 많은 설명이 되어 있고, 이 블로그에 가면 쉽게 정리된 자료를 볼 수 있다. 아무래도 서비스를 위한 빠른 알고리즘을 원하기 […]

계속 읽기

“경력 7년차 개발자의 선택” 을 읽고…

제목의 글을 읽고 나름의 생각들… 회사는 자신의 능력을 향상시키기 위해서 일을 주는건 아니다. 물론 회사의 도전적인 일을 맡음으로서 그런 일이 가능할지는 모르겠지만, 대부분 이사람이 하던일, 잘 하는일을 부여한다. 따라서 자신의 복수의 칼을 갈려면 회사와 일을 탓해서는 안되고 자신이 관심있고 추후 ‘칼’로 쓰일 기술 분야에 대해 자신의 시간을 할애해서 공부해야 한다는 것이다. 내 주변에 새벽에 가족들이 […]

계속 읽기