Lisp을 배울라는데…

윈도에서 Lisp을 배우려고 저녁마다 용을 쓰고 있는데. 이거 emacs하고 Clisp, slime을 연결하는데 5시간을 넘게 끙끙대다가 결국 포기를 했다. 어쩌다 처음 부분에서 잘 연결이 됐다 싶었는데 나중에 Lisp에러가 떨어져서 이래저러 다양한 버전을 깔아서 해보다가 포기했다. 그러다 한국 리습 사용자 모임에서 Lisp in a Box를 한번 사용하는것도 괜찮다고 해서 그거 깔아서 쓰고 있다. 원래 뭔가 설정하는데 그리 […]

계속 읽기

Lisp으로 Spam Filter 만들기

Lisp을 배워볼라고 전부터 이래저래 기웃거렸지만 생소해 보여서 이내 포기하기를 반복했다. 그러다가 어제 뭔 바람이 불었나 Lisp책을 붙잡고 문법을 보기 시작했다. 그리고 LispWorks를 깔고 Shell에다 한줄한줄 연습을 1시간 정도 해봤다. 소감은 굉장히 영어문법적인 언어라는 생각이 들었다. (+ 1 2 3 4) 더한다 1,2,3,4를 이렇게 해석해야 하나… 암튼 여태 배운 언어중에거 가장 문법이 특이한 언어라는건 맞군.. 게다가 […]

계속 읽기

Anchor Text에 대한 고찰

오늘 Crawler 커스터 마이징을 했다.(아주 오랜만이다…) 문제가 있었는데 그 문제라는게.. HTML 한페이지에서 나오는 Url과 Anchor Text를 저장을 하는데 개발하면서 한페이지에서 같은 Url이 다른 Text로 표현되어 나올것이라는 생각은 하지 못하였다. 그래서 계속 덮어 쓰기를 한거였다. 그래서 뉴스수집페이지에서 동일한 Url에 의미가 없는 짧은 Anchor Text가 저장이 된거였다. (뒤에 나오는 Anchor Text가 의미없는 Text였다) 그래서 Anchor Text의 길이를 […]

계속 읽기

형태소 분석기 개발6

검색엔진 개발자 그룹에서 헐랭이님이 아주 좋은 글을 올려주셔서 블로그에 적어본다. 내가 형태소 분석기 전처리 부분에 대한 질문을 올려준것에 대한 답변을 주셨다. 아래와 같이 그대로 한다면 만일 “C++ 템플릿”을 겁색할 경우 “C, 템플릿”만 분리가 될거다. 그렇게 되면 잘못 검색되는 결과가 나오지만 아래 답글은 의미가 있는 글이다. 최소한 어떻게 처리하면 된다 하는 아이디어 제공이라고나 할까… 아무튼 아래 […]

계속 읽기

공개 이미지 관리 툴 및 편집툴

이미지 소프트웨어가 사서 쓰는것들이 많아서 그리고 또한 비싸서 이래저래 무료 공개 소프트웨어를 찾아보곤한다. 고려대학교 라이센스로 그동안 쓰던 알See 사용하는걸 접었다. 화면 캡쳐 기능이 없다는거.. 또한 리소스를 무지 많이 잡아 먹는다는거 그리고 그 아주 눈에 거슬리게 달랑거리는 베너광고 때문이다. 그래서 XnView를 쓴다. 간단한 편집또한 아주 잘되고 뷰잉도 그나마 알See보다는 빠르게 된다. 이거와 더불어 지금 또 깔려 […]

계속 읽기

EditPlus 다시 사용하기

그동안 텍스트 에디터로서는 Crimson Editor를 주로 사용을 해왔다. 이건 Python 개발용도로 처음에 아주 잘 사용을 했다. Crawler및 UrlServer 그리고 여타 다른 Python 코드 조각들을 아주 편리하게 제작을 했었다. 그러다 설정파일을 xml로 입력을 받게 했는데 모듈 자체를 utf-8로 해버렸다. 이건 나중에 Linux나 Unix로 포팅할때 편리함을 강구하기 위해서 그렇게 만들었다. 그러나 왠걸 utf-8을 완벽하게 편집할수 있는 간단한 […]

계속 읽기

직장 다니면서 학교다니는 것

좋은점과 나쁜점을 한번 정리해봤다. 좋은점 1. 예비군을 1년에 8시간만 받으면 된다.(올해 이 덕을 많이 봤다) 2. 학교에서 필요한 책을 원없이 사서 볼수 있다.(학생때보나 금전적으로 그나마 자유롭다.) 3. 학교에서 배우는 지식이 현장에서의 중요한 기초및 아이디어의 원천이 될수 있다. – 실제적으로 웹로봇 개선 아이디어및 형태소 분석기 관련 지식은 학교에서 얻은 지식의 덕을 많이 봤다. 4. 회사내에서 전문가라는 […]

계속 읽기

pdf 관련 툴 및 라이브러리

PDF 관련 툴들 위에 포스팅 되어 있는 pdf툴중에 내 개인 노트북에서는 Foxit Reader를 주로 쓰고있고 변환기로는 PrimoPDF를 주로 쓴다. 그러나 쓰다보니 역시나 Adobe Reader가 모든 pdf에 대해서 가장 정확하게 보여준다는 사실을 알았다. 프린트 기능역시 다양한게 맘에 든다. 그래서 Foxit Reader를 쓰다가 잘 안나오는 문서를위해 adobe reader를 따로 깔아 두었다. 프로그램 개발하다보면 pdf를 일반 텍스트로 변환해야할 […]

계속 읽기

Dev-C++ 사용기

전에 Dev C++을 쓰다!라는 포스팅을 쓴적이 있다. 그 뒤로 쭈~욱 C 언어 관련된 개발을 Dev-C++로만 해왔다. 개발이래봤자 한국어 형태소 분석기지만.. 약 2000라인정도의 코딩을 해봤는데 그런대로 쓸만한 IDE라는 생각이 계속 드는군. 우선 eclipse정도의 능력을 부릴정도의 대단한 IDE는 아니더래도 아주 기본 기능에 충실한 IDE라는 생각이 든다. 메트릭스 테마 적용한 모습 — 디버깅 중이군.. C개발을 하면서 몇가지 환경적으로 […]

계속 읽기

IBM 노트북 사용기

몇달전에 IBM 노트북을 구매했었다. 아주 매일 가방에 넣고 다니면서 정말 잘쓰고 있지. 지금도 옆에 있는 노트북은 열심히 알고리즘 테스트를 하고 있는 중이다. 메모리도 업그레이드 하고 나름대로 최적화 시켜서 잘 다니고있는데 여자친구가 노트북 안이쁘다고 지금도 가끔 갈구긴 한다. IBM 노트북이 외관상 투박하기로 유명한 브렌드 인건 사실인데 잘 질리지 않고 보면 볼수록 정감이 가는 디자인것은 분명한거 같다. […]

계속 읽기