Collective Intelligence In Action 저자 Satnam Alag의 인터뷰

readwriteweb에 최근 번역중인 Collective Intelligence in Action 의 저자와 추천엔진(recommendation engine)에 대한 인터뷰가 실렸다. 이 글을 보면 저자가 추천엔진의 정확도 측면보다 이를 애플리케이션에 적용할 때 대용량 데이터와 수많은 사용자의 요구를 빠르게 충족시켜 줄 수 있으냐를 고민하고 있음을 알 수 있었다. 그래서 구글 뉴스의 추천엔진이 가장 인상깊은 추천 시스템이라고 말하고 있고 Netflix 추천 시스템 10% 향상 […]

계속 읽기

앙상블 러닝에 대한 좋은 발표자료

이 앙상블 러닝 방법은 이전의 포스팅에서도 소개를 한적이 있었다. 이 앙상블 방법에 대해서 상당히 잘 설명한 발표자료를 소개한다. 역시 이런것은 예제를 어떤걸로 제시하느냐가 이해도를 높이는 가장 중요한 방법중에 하나라는 생각이 든다. 여기서 netflix prize를 풀기위한 방법에 따른 개선정도를 표시한 그래프가 있는데 대부분 존재하는 방법으로는 다 시도를 해본거 같다. 그래서 아마도 이 ppt의 저자는 이 방법들을 […]

계속 읽기

netflix prize에 도전하고 있습니다.

netflix prize라는 해당 사용자가 보지 않은 영화의 점수를 예측하는 시스템을 만드는 대회이다. 상금이 무려 100만달러에 육박한다…@.@ 이것을 접하게된 계기는 hadoop mapreduce를 이용한 canopy clustering에 대한 자료를 찾다가 이 숙제 데이터셋을 보고 알게 되었다. netflix prize사이트에 가면 많은 설명이 되어 있고, 이 블로그에 가면 쉽게 정리된 자료를 볼 수 있다. 아무래도 서비스를 위한 빠른 알고리즘을 원하기 […]

계속 읽기