CI in Action 12장 추천엔진에 대해서

추천엔진이라는게 아시는분들은 잘 아시겠지만 자신이 구매한 물품을 기반으로 사용자 프로파일을 만들어서 그 프로파일과 비슷한 유저를 찾아 그 사람이 제일 많이 선호한 물품을 추천하는 알고리즘을 쓴다.(물론 상품 기반으로 계산할 수도 있다.)물론 이 말은 굉장히 피상적인 내용이고, 실제 서비스에 적용하기 위해서 이런 작업은 검색 전에 인덱싱을 하는것처럼 pre processing 작업을 거쳐서 정제 후 나올 수 있는 비동기적인 […]

계속 읽기

집중할 꺼리

요즘 많은 분들이 미디어를 통해 아시는것처럼 야후는 내.외적으로 많은 변화를 겪고 있다. 미국하고 멀리 있는 나라의 말단 직원인 나에게까지 이런 영향이 직접적으로 느껴질 정도이면 정말 말 다했다. 그래도 다행인 것은 그런 어지러운 주변 여건과 상관없이 나에겐 집중할 꺼리가 있다는게 정말 행복하다. 바로 이번에 새로 하게된 번역일인데 시도하기전에는 두려움이 반이였지만 어느새 이 일을 즐기고 있는 나를 […]

계속 읽기

번역작업에 아주 편리한 사전 구하다.

사실 실제 번역에 들어간지는 만 하루밖에 안된다. 하지만 그 하루동안에 꽤 많은 사전을 사용해봤다. 처음 주로 애용하던 야후 미니사전이 있었고 사실 이 미니사전은 내가 애용하는 Foxit Reader에 툴팁사전을 띄울만큼 강력한 어플리케이션이나 불행하게도 사전의 품질이 내가 원하는 사전의 품질과 큰 차이가 있었다. 그래도 가장 많은 어휘력을 자랑하는 사전이 네이버 사전이였는데, 반드시 온라인에 접속을 해야하고 야후 미니처럼 […]

계속 읽기

P(구매|광고클릭) : 광고를 클릭한 사람이 물품을 구매할 확률

회원가입시 알수 있는 재미난 feature가 있다. 대부분 주소를 입력하라고 하는데, 이들 주소를 이용해 이곳에 살고있는 사람들의 소득 수준을 가늠 할 수 있다. 물론 이런 데이터는 부동산 시세가 가늠이 되겠고 우리나라 통계청에서 제공하는 그런 데이터를 사용해도 될 듯 하다. 사용자 매칭 광고를 올릴때 이들 소득 수준에 대한 감안을 하게 되는데 P(구매|광고를 볼 시) 같은 확률을 올리기 […]

계속 읽기

Collective Intelligence In Action 통독 소감

Collective Intelligence In Action 을 번역하기 위헤 통독을 마쳤다. 일단 한명의 독자로서 소감을 말해보자면 Programming Collective Intelligence 과 함께 Machine Learning을 서비스의 관점에 따라 실용화 하고자 하는 노력이 담긴 책이라고 말하고 싶다.  일단 Programming Collective Intelligence가 짧고 강력한 Python 언어로 다양한 예제를 매우 효과적으로 표현했다면, CI in Action같은 경우는 다양한 알고리즘을 보여주기 보다는 키가 되는 […]

계속 읽기

아들에게 반드시 물려줘야 할 것 한가지

때로는 외로움을 달래기 위해서 책을 읽는 경우도 있다. 주변에 독서를 즐겨 하는 사람이 별로 없다. 그래서 좀 외로울때 독서에 대해서 이야기 할 수 있는 사람을 찾는데 그것도 여의치 않으면 결국 맘 편하게 독서에 대한 책을 읽는다.  읽으면서 한껏 공감하고 저자의 독서법을 배우며 꾸준히 독서하는 사람이 나뿐만이 아니라는것을 느낄 수 있게된다. 나에게 공부, 독서에 대한 책들이 […]

계속 읽기

Clojure의 ref

Clojure의 모든 변수는 immutable 변수이다.(하긴 바뀌지 않으면 변수라고 할 수 없겠다.) 물론 몇몇 언어에서도 불변 변수를 쓰기는 하지만 Clojure의 그것은 Erlang의 그것과 유사하다. 왜냐면 같은 변수명에 값을 새로 assign하는것도 기본적으로는(?) 불가능하기 때문이다. ㅋㅋ 아무래도 concurrency를 지향하기 때문에 다분히 그런거라 생각했지만 영 몇몇 테스트 코딩하는데 불편함이 있어서 자바 객체를 만들어서 그곳에 저장하곤 했다. 그러니까 함수내 로컬 […]

계속 읽기

Clojure를 통해 Lisp을 다시 보다.

역시나 언어는 문법을 알고 조금 연습해 본다고 해서 그 언어의 깊은 철학을 이해하는건 아닌가 보다. 문법을 배우고 한 1년 정도는 잘짠 코드들을 보면서 꾸준히 코딩을 해봐야 비로소 그 언어의 깊은 맛을 느낄 수 있을거 같다. Clojure의 문법을 조금 보고 코딩 좀 해보다가 Practical Common Lisp의 예제 코드를 Clojure로 포팅한 사람의 블로그를 보고 있는데 이 포스팅들에서 […]

계속 읽기

Clojure로 짜본 weka API 활용 예제

Weka API와 Clojure를 활용 남자인지 여자인지 맞추는 프로그램을 짜보았다.Weka API와 Clojure 모두 아직 익숙치 않다는 점 염두에 보시길 바란다. ^^; 일단 아래와 같이 학습셋이 주어져 있다. 나이, 성별, 로그인 횟수 40   , 남자,      1020   , 여자,      1310   , 여자,      1530   , 남자,      920 […]

계속 읽기

포털 첫 화면 뉴스 자동 제너레이션 고민들

예전에 포털의 뉴스 편집권에 대한 이야기들이 정치권에서 많은 이슈가 되었던 적이 있었다. 그때 집단지성이라는 말도 나오고 편집 방향에 따른 잘못된 편집들이 이상한 여론을 조장한다는 이야기들이 상당한 반향을 일으켰다.  대표적으로 아고라가 표적이 되기도 했고… 사실 대부분의 포털에서 메인 창에 뜨는 뉴스를 에디터가 직접 편집한다. 물론 이런 에디터들의 교육은 뉴스섹션의 편집장이 하겠지만 말이다. 그래서 포털마다 뉴스의 방향성이 […]

계속 읽기