Head First 시리즈에 폭 빠지다.

살면서 내가 원하던 내가 궁금했던 부분이라고 생각한 곳을 시원스래 긁어주는 그런 책을 만나는건 그리 쉬운일이 아니다. 한장 한장 넘길수록 정말 놀라움을 금치 못하는 책이 있었으니 그 책이 바로 Head First 시리즈다. 이전에는 몰랐지만 Head First Statistics를 완독하고 너무 감동을 받아서 이 시리즈를 주목하고 있다. 이 책만큼 hypothesis test / confidence interval을 다양한 확률 분포를 대상으로 […]

계속 읽기

검색 결과를 타겟으로 하는 해킹 사이트

이런 해킹 유형을 파악하기 위해서 몇가지 필요한 툴이 있다. 그리고 HTTP 프로토콜에 대한 약간의 지식이 있으면 훨씬 이해하기 편할 것이다.   1. Firefox 2. Live HTTP (Firefox add in) 3. Modyfy Headers (Firefox add in) 4. Web Developer (Firefox add in)   구글 검색 결과를 확인해 보자. "오리엔탈드림" 쿼리를 사용한 구글 결과  위 링크를 클릭하고 […]

계속 읽기

어려운 책 관망하기

일단 그렇게나 배우고 싶었던 Machine Learning에 대해서 조금은 안다고 말할 수 있을거 같다. 이쪽 분야의 교과서라 할 수 있는 T.Mitchell의  Machine Learning 책을 하루에 단 두장밖에 이해하지 못했던 나였는데 이제는 이것보다 더 재미있는 책들을 보고 있으니 말이다. 이 시기에 학교의 도움이 굉장히 컸다. 이 분야를 공부하면서 이런걸 공부하는 사람은 도대체 괴물들이 아닐까 하는 생각까지 했었는데 […]

계속 읽기

검색 로그를 검색에 다시 이용하기 – 구글 바로가기

검색 로그(Query Log)로 할 수 있는 것 내가 위 분의 블로그를 자주 찾는 이유는 국내 말고 외국의 대학의 석, 박사 연구원들은 뭘 연구할까 궁금해서이다. 올라오는 글을 보면 구글이나 야후에서 이미 하고 있는 일들을 주로 연구하는거 같다. 국내에서는 포털 및 학계의 기술적인 교류가 거의 없어서 기술적 그리고 서비스적 연구가 서로 다른것에 비하면 정말 부러운 환경이지 않을 […]

계속 읽기

2008 한글 및 한국어 정보처리 학술대회

지난 금,토 서울대에서 2008 한글 및 한국어 정보처리 학술대회가 있었다. 개인적인 사정으로 아쉽지만 금요일만 참가했었다. 논문집을 보니 작년 나의 논문을 레퍼런스한 논문이 좀 있었다. ^^;아래 두 논문이 그 논문들이다. 동시출현 자질과 집단 지성을 이용한 지식검색 문서 사용자 명성 평가, 이현우(창원대), 한요섭, 김래현(한국과학기술연구원), 차정원(창원대) Topic signature와 n-gram을 이용한 댓글 분류 시스템, 배민영, 차정원(창원대) 첫번째 논문은 동시출현 […]

계속 읽기

통계책들…

올해 처음 봤던 책은 서점에서 직접 고른 앤더슨의 통계학이라는 책이였다. 한동안 이 책만 보면서 통계를 음미했던 시기가 있었다. 게다가 직접 엑셀로 돌려보면서 결과를 확인하는 작업을 직접할 수 있어서 실무에 적용하기 위해 상당한 참고가 되었던 책이였다. 사실 위 책의 내용이 너무 좋아서 살짝 숨기고 있었는데 최근 이것만큼 좋은 책들을 보는 관계로 올려봤다. 두번째 책은 전에도 소개했던 […]

계속 읽기

Disco 0.1 분석하기

최근에 Disco 0.1버전을 살펴보고 있다.이유는 내가 관심을 가지고 있었던 분산처리를 하기 위한 프로젝트이고, 더군다나 Erlang으로 만들어져 있는 몇 안되는 오픈소스 프로젝트중에 하나이기 때문이다. Disco를 가지고 몇몇 map/reduce 프로그램을 돌려봤는데 꽤 괜찮아 보인다. 물론 같은 기능을 하는 Hadoop이라는 걸출한 프로젝트가 있지만 Hadoop이 소잡는 칼이라면 Disco는 닭잡는 칼 정도라고 보면 될거 같다. 분석하면서 내가 여태 간과하다 시피 […]

계속 읽기

번역에 대한 책

예비군 훈련에 가서 책 두권을 읽고 왔다고 했는데, 그 책중에 한권이 번역에 대한 책이였다. 번역을 시작한다면 한번정도 읽어봄직한 책이였다. 여태 번역을 하시는 주변분들에게 들었던 많은 팁들이 책에 자세하게 나와있었다. 나도 번역한번 해볼까? 책에서 나온 번역가로서 갖추어야 할 것들은 함축적으로 아래의 문장에 나와 있다. 번역은 외국어를 ‘좀’해서는 어림도 없습니다. 번역하려는 분야와 관련된 지식과 새로운 지식을 빠르게 […]

계속 읽기

장교 대상 동원훈련을 다녀오다.

동원훈련으로 다녀왔다. 솔직히 현역시절에는 나름대로 사명감을 가지고 군생활을 했었는데 예비군때는 많이 약해 지는듯 싶다. 이제 5년차 훈련을 마치고 훈련으로 치면 1년 남았다. 장교 전역자가 좀 길다고 하던데 벌써 5년차여서 그런지 이제는 좀 지겹기도 하다. 늘어난 뱃살이 그 세월의 흐름을 확연하게 느끼게 해주곤 하는데 그래도 다행인게 예전 군대적 쓰던 혁대로 대충 사용이 가능했다. 1년차 훈련때 강원도 […]

계속 읽기

검색 성능 개선의 두가지 방법

월간 마소에 기고글을 넘겼는데 적은 분량에 하고 싶은 이야기는 많고 수식을 최대한 줄이고 하려니 거의 주화입마에 걸릴뻔 했다. 검색 성능 개선을 위한 두 가지 방법에 대해서 설명하고 각 기술들의 차이점과 구현시 신경써야될 부분들에 대해서 썼다.초기 의도했던 부분들의 내용도 들어 있지만 개인적인 생각과 관점을 줄이고 기술적인 내용을 첨가하려 노력했다. 두 가지 방법이란 흔히 편집기술이라고 이야기 하는 […]

계속 읽기