introduction to information retrieval 번역서

전혀 기대하고 있지 않았는데, 3월달에 이 책의 번역서가 나왔다는 것을 오늘 알았다. 그래서 바로 주문하고 몇 챕터 확인 후 포스팅을 써본다. 야후 웹검색, YST라고 불리우는 기술이 현재로서는 MS로 대부분 넘어간 상태지만 그 전에 이 책이 나오게 된것을 상당히 다행스럽게 생각하고 있다. 알고 있는 분들이 이미 있겠지만 이 책의 공저자중에 한 분이 야후 리서치를 책임지고 있는 […]

계속 읽기

김상형씨의 ‘안드로이드 프로그래밍 정복’ 리뷰

안드로이드 프로그래밍 정복 한빛 출판사 리뷰용 서적을 받아보고 이제야 리뷰를 블로그에 올린다.(너무 늦어서 누가 되지 않을까 고민이다. ) 지금까지 나왔던 번역서 위주의 국내 안드로이드 프로그래밍 서적과는 다른 집필서라는 점이 가장 눈에 띈다. 게다가 한 2/3 정도 읽어본 소감으로 역시 국내서라는 장점을 아주 잘 살린 여러 팁들이 있다는 것인데 특히 앞부분 안드로이드 개발 환경 설정시 한글문제 […]

계속 읽기

흉내내기 힘든 인간 지적판단과 지능형 소프트웨어

요 데이터마이닝 관련 프로젝트는 많은 소프트웨어 개발자들이 느끼는 개발자 자신의 겸손한 자세를 요구하는것과 더불어 인간 지적판단의 위대함을 다시한번 느끼게 해주는 몇 안되는 프로젝트이다. 많은 소프트웨어의 버그 해결 과정은 깊은 자기 반성의 시간이 된다. 자신에 대한 확신이 강한 사람은 심지어 컴파일러까지도 의심하지만 대부분의 경우 본인에게 문제가 있다. 이런 과정이 반복되고 경험이 쌓이면 개발자 자신이 자신에 대해서 […]

계속 읽기

데이터 마이닝은 과학과 기예의 결합작

과학(science)와 기예(art)… 뭐 일단 이렇게 영어로 표현해 볼 수 있겠다. 국어 사전을 보니 기예가 “기술에 대한 재주”라고 표현되어 있는데, 내가 의도한 의미와 일맥상통한다. 개인적으로 데이터 마이닝이라는 단어를 좋아한다. 이 처럼 이 학문 영역을 잘 성명할 수 있는 이름은 없기 때문이다. 과정 자체가 금맥을 찾는 과정과 흡사하다. 많은 데이터 마이너들이 알고리즘으로부터 시작을 한다. 하긴 거의 모든 […]

계속 읽기

Data Mining, Third Edition: Practical Machine Learning Tools and Techniques

Data Mining, Third Edition: Practical Machine Learning Tools and Techniques (The Morgan Kaufmann Series in Data Management Systems) 2판은 현재 내 책상 위에도 있을 정도로 즐겁게 참고하는 책이 되어 버렸다. 2판이 나온지 5년이 되가고 있고 3판 언제 나올까? 하고 찾아보고 있었는데 2011년 초 출간 예정이다. 역시 최신 트렌드를 다루고 있다.대용량 데이터 셋 처리, 앙상블 러닝, […]

계속 읽기

Fullwidth Forms in Unicode

알파벳을 표현하는 이런 다양한 방법들이 있다는 것에 감사한다. 따라서 유니코드 문자들을 속속들이 한번쯤 들여다 보는 경험을 해보는게 정말 중요한듯 하다. from Wikipedia Chart Halfwidth and Fullwidth Forms Unicode.org chart (PDF) 0 1 2 3 4 5 6 7 8 9 A B C D E F U+FF0x ! " # $ % & ' ( […]

계속 읽기

성공적인 성능 개선

계속 금요일날 일을 못하다 보니 일이 좀 밀려 있었고, 몇몇은 선행 작업들이 연기되면서 덩달아 나 자신의 성과도 내기가 쉽지 않았다.  일도 중간에 자주 끊기는거 같기도 하고 말이다. 근 3주동안 컨퍼런스콜에서 거의 업데이트를 못하고 있다가,  고향 내려가기 전날 오늘…의미심장한 결과를 컨퍼런스콜에서 이야기 할 수 있었다. 무엇보다 오늘 발표한 작업이 서브 프로젝트였으며, 다른 개발자의 작업 결과를 기다리는 […]

계속 읽기

나의 디지털 자료들에 대한 소유권

오늘 기사글을 보다가 블로거가 사망한 이후에 그 블로그 자료에 대한 소유권에 대해서 어떻게 할것인가 하는 기사를 봤다. 그래서 생각난김에 내 블로그 계정을 비롯해 여러 서비스를 나열하고 정리해 보고자 한다. 일단 이 블로그는 워드프레스 개인 호스팅 계정이며 http://www.mireene.com/ 에서 호스팅 되고 있다. 포스팅 개수가 꽤 되는데 전체글중에 비공개 글이 내 예상에는 20% 정도는 되리라 생각한다. 블로그의 […]

계속 읽기

플랫폼, 개발자의 나라 미국으로..

먼저 이 글을 쓰기 전에, 소프트웨어 개발의 본좌는 미국이라는 것을 미리 밝혀둔다. 가장 소프트웨어 개발의 역사가 긴만큼, 그들의 능력, 환경 그리고 소프트웨어에 대한 관점은 너무도 한국 개발자… 심지어 아시아쪽 개발 환경하고는 다르다는것을 …. 요즘 회사 내적으로 많은 변화를 겪고 있는게 사실이다. 그래서 개발자 채용에 대한 문의가 참으로 나에게는곤혹스럽기 그지 없다. 그러니 이 글을 보시는 분들중에 […]

계속 읽기

Deep Crawl

웹 크롤로 검색일을 시작 해서 그런지 웹 크롤의 여러 이슈에 대해서 지금도 많은 관심이 있다. 그러다 구글에서 연구하고 실제 적용한 Deep Crawl알고리즘을 틈틈히 지하철에서 살펴볼 기회가 있었다. 구글이 이야기하는 Deep Crawl은, Form 태크의 실행(submission)으로 생성되는 get방식의  URL을 어떻게 하면 정보가 많게끔 자동으로 생성해 내느냐를 고민한 결과였다. 실제 아래와 같은 폼들을 이용해 검색 하는 방식이 주된 […]

계속 읽기