집단 지성 프로그래밍에 관한 책

한글로 책 제목을 직역하니 거창한 제목이 나오는군. ㅋㅋ 요즘 책을 많이 읽고 있기는 하지만 그닥 이 블로그에다 소개를 하지는 않고 있다. 뭔가 삘이 안온다고 해야하나? 그러다 엄청 삘을 받는 책을 발견했다. Programming Collective Intelligence: Building Smart Web 2.0 Applications 오라일리에서 이런 책이 나오다니… 정말 대단하다. 실제로 학교에서 배우는 Machine Learning이나 Data Mining이 약간은 현실과 동떨어진 […]

계속 읽기

논문 제출!

교수님이 아시면 천인공노할 사건이지만 일단 작업했던거 방금 제출했다.^^; 솔직히 제출을 처음 해보는것이라서 시험삼아 제출해봤다는게 정답일거 같다.뭐 오늘 제출본에서 완성본이 내용상 크게 다르지 않을것이라는 생각을 하고 있었으니까… 내일정도 교수님의 comment가 있을거고  나머지 작업하고 마무리 지어야 겠다. (올린 다음에도 당연히 수정 가능하다.) 19회 한글 및 한국어 정보처리 학술대회의 정보검색 카테고리에 제출했는데 나의 제출 번호가 28번이니 28번째 정도 […]

계속 읽기

D 언어에서 lib호출해서 쓰기

오늘 아침에 GeoIP라는 라이브러를 이용해서 도메인에 대한 IP 지역정보를 뽑아볼 일이 있었다. 이거  Python 바인딩이 있고, 그냥 C로 만들면 바로 구동해 볼 수 있었는데 걍 D로 바인딩 하는 작업을 해서 해봤다.  사실 D로 해보고자 했던 가장 중요한 이유는 GeoIP.h파일이 너무 간단하게 되어 있어서 이걸 D헤더(?)로 변환하는 작업이 거의 필요 없었기 때문이다. 사실 이 작업만 하면 […]

계속 읽기

야후 블로그 검색 간담회

정말 오랜만에 열혈블로거들의 모임이 있었다. 처음에는 별 말씀들이 없다가, 각자 생각하는 블로그 검색의 방향과 블로그란 무엇인가에 대한 토론 그리고 더 심오하게 블로그 검색을 왜 하느냐의 질문까지…. 정말 다양했다.사실 블로그 검색을 논하기 전에 블로그가 무엇인지, 왜 쓰는지 그리고 왜 블로그 검색을 하는지에 대해서 고민이 먼저 되었어야 되지 않을까 했다.블로그 검색 서비스라는 테마에서 블로그 검색을 왜 하느냐까지 […]

계속 읽기

Programming Erlang

몇일 전부터 erlang tutorial을 보면서 코드를 치고 놀다가 아침에 출근하자 마자 책을 주문해서 오후 늦게야 받았다.(원서를 주문한지 하루만에 받아보긴 처음이다.) Programming Erlang이라는 책인데 요즘 꽤나 잘 나가는 책인가 보다. 강컴이나 yes24의 원서 코너에서 상당한 판매량을 자랑하고 있으니 말이다. 뭐 말만들어본 함수형 언어를 처음 접해보는거라 좀 어색하긴 하지만 나름 흥미롭게 보고 있다. 목차를 보고 책을 빨리 […]

계속 읽기

Break Through하다.

어제 작업에 획기적인 변화가 있어 논문 실험이 95% 끝나버렸다. ^^ 이전에 내가 잘못한것은 문서 길이에 대해서 노말라이즈 하는것을 빼먹었다는 것과 중요 주제어를 추출하는것을 간과 했다는 것이였다. 그렇게 새로운 프로세싱 과정을 추가하고 새로운 식을 만들어서 적용해다. 논문 제출 기간은 다가오고 결과가 잘 나오지 않으면 어쩌나 하구 노심초사 하면서 작업을 했는데 정말 다행히도 실험 결과와 과정에 만족한다. […]

계속 읽기

모야… Freshness가 이렇게 좋아? 야후 블로그 검색…

이전 포스팅을 올린지 30분 정도 지났는데 야후 블로그 검색에 떡하니 나타났다.(정확히 포스팅 후에 평균적으로 얼마정도 걸리는지는 잘 모르겠지만 정말 빠른 시간임에는 분명하다.) Freshness가 좋다는 이야기를 많이 들었는데, 실제 체험하니 장난아니다.  거의 웹기반 rss 리더기 수준이구먼.. 30분만에 떡하니 나타나다.. 야후 블로그 검색이요. 검색 rss 버튼 추가해 주세요…! 검색 이야기를 하는 블로그들만 rss로 받고 싶어요. ㅎㅎ 암튼 […]

계속 읽기

Language model을 이용한 blog spam 제거 논문

2달전쯤에 내 생각과 같음에 깜짝 놀라버리고 좌절가까이 하게 했던 논문을 소개해본다. Blocking Blog Spam with Language Model Disagreement, G. Mishne, D. Carmel, and R. Lempel. In: AIRWeb ’05 – First International Workshop on Adversarial Information Retrieval on the Web, at the 14th International World Wide Web Conference (WWW2005), 2005. 위의 논문인데 2005년에 저런 생각을 먼저 […]

계속 읽기

소설보다 이상한(Stranger than fiction) 에 나오는 시계

오늘 여자친구에게 엄청난 선물을 받았다. “소설보다 이상한”이라는 영화에서 보고나서 지금까지 시계 전문점에 가서 항상 찾아보던 시계였는데 내가 가지고 싶어한다는 눈치를 챘는지 오늘 선물을 주더라.. 사실 국내에서는 이 시계를 구입할 방법은 없다. timex 시계가 많이 수입이 되고 있지만 이 시계는 찾아볼 수가 없었다. 미국에서도 영화 개봉후 엄청난 인기를 끌어버려서 더더욱이 국내에서 구입하기 힘들었는지 모르겠다. 그런데 용케도 […]

계속 읽기

지금 읽는 책이 현업 기술 수준과 어떤 차이가 있을까?

오늘 몸이 안좋은 관계로 빌빌대다가 부장님에게 뭔가 물어보러 갔다가 2시간 가까이 강의를 들었다. 오호~~~~~ 얼마전에 구한 새로운 정보검색책을 보면서 감동을 먹었던 시간이 예습시간이였다고 하면 이번엔 진짜 수업시간에 강의를 듣는 기분이였다. 강의 내용이 사실 회사에서 내부적으로 하는 부분을 제외하고는 다 얼마전에 책을 보고 터득한 부분이여서 집중도는 극상이였다. 그 부분에 대해서 책을 볼때 그저 나 자신과의 이야기만 […]

계속 읽기