서울의 프로그래머에게는 “뉴욕의 프로그래머”는 소설이 될 수 밖에 없는가?

황석영님의 바리데기에 이어서 이번에도 흥미롭고 재미있는 소설이 걸려들었다. 이번에 선택한 소설은 뉴욕의 프로그래머라는 책인데 받자마자 지하철서 틈틈히 보면서 지금은 약 2/3정도 진도가 나간 상태이다. 책을 보면서 주인공 영우가 저자인 임백준님의 투영이 아닐까 하는 생각도 해봤다.책의 서문에서 보면 저자분께서 이 소설에 나오는 인물들의 모티브가 되었던 팀원들에게 감사한다는 말이 있으니 그리 허황된 소설은 아니라고 본다. 소설속 팀을 […]

계속 읽기

스팸 클러스터 알고리즘 평가 방법과 논문 실험 결과

이번에 논문을 쓰면서 내가 아는 가장 최다의 클러스터링 성능 측정 방법을 써서 평가했다. 야후에 와서도 느낀거고 논문을 쓰면서도 느낀거지만 알고리즘 자체를 만드는 것만큼 중요한것이 이 알고리즘이 어느정도 성능 향상은 없는지 다각도로 그리고 심층적으로 체크해 보는 일이였다. 실험 그 결과에 대해서 객관적인 결론을 낸 결과가 다른 알고리즘을 개발하기 위한 어떤 시발점이 되지 않다 하는 생각을 해본다. […]

계속 읽기

이달중에 고려대에서 검색엔진 세미나가 있을 예정이다.

이 사실은 어제 교수님과 이야기 도중에 나왔다. 세미나 제목이 “검색엔진의 기초” 이거 발표하시려고 NHN과 Yahoo!에서 검색엔진 실력자들이 오신다는 말씀을 하셨다.(구글도 오려나? 이건 확인 해봐야 겠다.) Yahoo!에서는 같이 일하시는 부장님께서 가신다는 말씀까지 들었다. (사실 부장님… 정말 검색엔진에 대해서 굉장한 전문가시다. 나도 가서 듣고 싶다.) 이것도 그렇고 NHN에서도 온다니 질문 보따리 가지고 가서 풀어봐야 겠다. 자세한 일정은 […]

계속 읽기

논문에도 스토리가 필요하다.

어제 교수님이 조금 일찍 와서 논문 이야기좀 하자고 해서 좀 일찍 학교를 찾았다.사실 어제 졸업생 환송회가 있었다. 그래서 교수님도 어짜피 만나뵈어야 하고 해서 퇴근하지 마자 학교로 달렸다. 뭐 논문 실험과 결과에 대해서 특별하게 꼬집어 주시는 부분은 없었다. 사실 논문 실험 결과가 예상대로 나와줘서 아마 그 부분에 대해서 지적받았으면 좌절하고 말았을 것이다. 교수님의 말씀의 요지는 이랬다. […]

계속 읽기

집단 지성 프로그래밍에 관한 책

한글로 책 제목을 직역하니 거창한 제목이 나오는군. ㅋㅋ 요즘 책을 많이 읽고 있기는 하지만 그닥 이 블로그에다 소개를 하지는 않고 있다. 뭔가 삘이 안온다고 해야하나? 그러다 엄청 삘을 받는 책을 발견했다. Programming Collective Intelligence: Building Smart Web 2.0 Applications 오라일리에서 이런 책이 나오다니… 정말 대단하다. 실제로 학교에서 배우는 Machine Learning이나 Data Mining이 약간은 현실과 동떨어진 […]

계속 읽기

논문 제출!

교수님이 아시면 천인공노할 사건이지만 일단 작업했던거 방금 제출했다.^^; 솔직히 제출을 처음 해보는것이라서 시험삼아 제출해봤다는게 정답일거 같다.뭐 오늘 제출본에서 완성본이 내용상 크게 다르지 않을것이라는 생각을 하고 있었으니까… 내일정도 교수님의 comment가 있을거고  나머지 작업하고 마무리 지어야 겠다. (올린 다음에도 당연히 수정 가능하다.) 19회 한글 및 한국어 정보처리 학술대회의 정보검색 카테고리에 제출했는데 나의 제출 번호가 28번이니 28번째 정도 […]

계속 읽기

D 언어에서 lib호출해서 쓰기

오늘 아침에 GeoIP라는 라이브러를 이용해서 도메인에 대한 IP 지역정보를 뽑아볼 일이 있었다. 이거  Python 바인딩이 있고, 그냥 C로 만들면 바로 구동해 볼 수 있었는데 걍 D로 바인딩 하는 작업을 해서 해봤다.  사실 D로 해보고자 했던 가장 중요한 이유는 GeoIP.h파일이 너무 간단하게 되어 있어서 이걸 D헤더(?)로 변환하는 작업이 거의 필요 없었기 때문이다. 사실 이 작업만 하면 […]

계속 읽기

야후 블로그 검색 간담회

정말 오랜만에 열혈블로거들의 모임이 있었다. 처음에는 별 말씀들이 없다가, 각자 생각하는 블로그 검색의 방향과 블로그란 무엇인가에 대한 토론 그리고 더 심오하게 블로그 검색을 왜 하느냐의 질문까지…. 정말 다양했다.사실 블로그 검색을 논하기 전에 블로그가 무엇인지, 왜 쓰는지 그리고 왜 블로그 검색을 하는지에 대해서 고민이 먼저 되었어야 되지 않을까 했다.블로그 검색 서비스라는 테마에서 블로그 검색을 왜 하느냐까지 […]

계속 읽기

Programming Erlang

몇일 전부터 erlang tutorial을 보면서 코드를 치고 놀다가 아침에 출근하자 마자 책을 주문해서 오후 늦게야 받았다.(원서를 주문한지 하루만에 받아보긴 처음이다.) Programming Erlang이라는 책인데 요즘 꽤나 잘 나가는 책인가 보다. 강컴이나 yes24의 원서 코너에서 상당한 판매량을 자랑하고 있으니 말이다. 뭐 말만들어본 함수형 언어를 처음 접해보는거라 좀 어색하긴 하지만 나름 흥미롭게 보고 있다. 목차를 보고 책을 빨리 […]

계속 읽기

Break Through하다.

어제 작업에 획기적인 변화가 있어 논문 실험이 95% 끝나버렸다. ^^ 이전에 내가 잘못한것은 문서 길이에 대해서 노말라이즈 하는것을 빼먹었다는 것과 중요 주제어를 추출하는것을 간과 했다는 것이였다. 그렇게 새로운 프로세싱 과정을 추가하고 새로운 식을 만들어서 적용해다. 논문 제출 기간은 다가오고 결과가 잘 나오지 않으면 어쩌나 하구 노심초사 하면서 작업을 했는데 정말 다행히도 실험 결과와 과정에 만족한다. […]

계속 읽기