새해 첫 모임…

새해 첫 술자리는 맘 맞는 분들과 함께 하는 행운을 가졌다. 오늘 이야기한 문장들에서 생각나는 것들만 적어 봤다.    “데이터 기반 지능형 소프트웨어 개발에서 ‘코드’ ‘모델’ ‘데이터’ 이것들을 동시에 개선하게 되는데 어느 두 부분을 고정시키지 않고서는 어느 부분이 문제의 원인인지 알기가 힘들다.”   “기계학습 모델링을 한다는 것은 인간의 인지 과정을 이해하기 위한 과정이다”   “랭킹을 하던 […]

계속 읽기

2010년 후기

어떻게 하다보니 올해의 마지막 날에 이르른거 같다. 블로그를 찾아보니 2010년에 대한 계획은 세워놓지 않은거 같다. 그 이유에 대해서는 어느정도 기억이 나고 있으나 결국 그 이유가 되는 것들도 올해 다 마무리가 된 듯 하다. 개인적으로 가장 굵직했던 일은 회사 프로젝트의 마무리였고, 번역 마무리가 있었다. 회사 프로젝트를 마무리 하면서 예상치 못하게 논문도 2편이나 썼으며 우수논문 선정까지 되었으니 […]

계속 읽기

<출간> 실전 예제로 살펴보는 집단지성 프로그래밍

Yes24 링크 알라딘 링크 인터파크 링크 교보문고 링크 반디앤루니스 링크 번역의 동기는 이런 데이터마이닝이나 기계학습 관련 응용 기술이 국내에 많이 퍼지길 바라는 의도와 함께,  웹2.0이라는 개념이 나온 후 많은 시간이 흘렀음에도 불구하고 국내에서는 아마존과 같은 좀더 지능화된 웹 사이트가 국내에 등장하지 않음에 대한 원망(?)도 그 동기가 되었던 거 같다. 하지만 그 강한 동기만큼 번역 기간 […]

계속 읽기

Lucene spellcheck package

요즘 루씬 코드 리딩을 하고 있다. 루씬 core 패키지는 예전에 한번 분석 해본 경험이 있어서 이번엔 contrib 패키지를 중점적으로 살펴보고 있다. 그중에서도 spellcheck 모듈은 가장 최근에 성능좋은 라이브러리로 구현한 경험이 있어서 관심이 갔다.  이 패키지 내에서는 Jaro Winkler Distance 라는 짧은 이름에서 사용 가능한 string 비교 클래스가 구현이 되어 있었으며 n-gram 기반의 string 비교 클래스도 […]

계속 읽기

Buffalo NAS WSL/R1 이런 저런 메모들

최근에 Buffalo NAS 장비 하나를 구매했다. 사실 사진 및 동영상 저장 용도로 쓸라고 했는데, 아직 그 용도로 활용 보다는 파일 공유 및 웹서버 설정해서 Django 코드 테스트 해보는데 사용 하고 있는 중이다. 이래저래 많은 시행 착오 끝에, 머신 ssh 로그인을 외부에서도 가능하게 만들어 두었고, 기본적으로 사용할 수 있는 BitTorrent 웹 클라이언트까지 외부 접속이 가능하게 오픈해 […]

계속 읽기

찰스 펫졸드의 코드:CODE

이번달 인사이트 출판사 리뷰용 도서로 받은 “CODE:코드“에 대한 서평을 올려본다. 처음 이 책을 받아보고 바로 느낀건, 내가 학교에서 가장 흥미를 느끼지 못했던 “컴퓨터 구조”에 대한 책이구나, 하는 생각을 했다. 그러나 이 생각은 초반 몇 장을 읽으면서 사라졌고, 컴퓨터 구조에 대한 책이라기 보다는 컴퓨터에서 사용하는 언어 즉 코드들이 하드웨어로 어떻게 구현이 되는지 여러 코드 체계에 대한 […]

계속 읽기

학술대회 우수 논문으로 선정되었네요

지난 한글날 전남대에서 있었던 22회 한글 및 한국어 정보처리 학술대회 오랄세션에서 발표한 논문이 학술대회 우수논문으로 선정이 되었다는 메일을 받았다. 기대하지도 않았는데… 막상 받아보니 기분은 좋다. 그나저나 이번에 쓴 논문에서 30%의 내용을 추가 해야 된다고 하는데 그럼 또 하나의 논문을 쓰는건가? 여튼 교수님 및 회사분들하고 논의를  해봐야겠다. 어떤게 우수논문이 되는지 보시고 싶은신 분들을 위해 링크를 다시 […]

계속 읽기

제22회 한글 및 한국어 정보처리 학술대회 논문과 소감들

잠깐 기차 시간까지 시간이 남아 광주역 로비에서 던킨 도너츠 커피와 함께 블로그 포스팅을 해본다. 일단 발표된 논문을 공개한다. 한글 검색 질의어 오타 패턴 분석과 사용자 로그를 이용한 질의어 오타 교정 시스템 구축 (DropBox 공개 링크를걸어 봤다.) 한글 쿼리 오타 패턴에 대한 리서치 내용과 추천 시스템 구현이 주요 내용이다. 아무래도 국내 관련 논문이 거의 없어서 분량이 […]

계속 읽기

Word Segmentation

Natural language processing with Python 이라는 책을 보다가 3.8절에 Word segmentation 프로그램을 simulated annealing 방법으로 예제를 올려 놓았길래.. 호기심이 발동해 이것을 유전(Genetic) 알고리즘으로 해찾기를 코드를 작성해 봤다. “doyouseethekittyseethedoggydoyoulikethekittylikethedoggy” 위 문자열을 제대로 자른다면… “do you see the kitty see the doggy do you like the kitty like the doggy” 뭐 이런식으로 될 것이다. 이런 세그먼트를 표현하기 위해 […]

계속 읽기

실리콘벨리의 개발자에서 국내 기업 CTO까지 경험하신 분의 이야기

어느때부터인가 책을 고를때 저자의 이력을 먼저 살피는 습관이 생겼다. 이는 저자의 학력을 확인하고자 하는건 전혀 아니고 다면 저자가 어떤 경험을 해왔는지 살펴보기 위함이다. 특히나  컴퓨터 공학쪽 그리고 소프트웨어 공학의  경우 이는 상당히 큰 의미가 있다고 생각한다. 그런 의미에서 “글로벌 소프트웨어를 꿈꾸다“를 집필한 김익환님의 책은 나의 구미를 당기기에 충분한 책이였다. 이분의 이력은 소프트웨어 개발의 엘리트코스를 밟은 […]

계속 읽기