요즘 읽는 책
정규 표현식 완전 해부와 실습 요즘 읽고 있는 책이다. 정규표현식에 대해서 그동안 우습게 보고 간단한걸로만 생각했는데. 이 책에서는 하나의 언어로 접근을 해버렸다. 아마도 정규식에 대해서 이런 접근을 해서 설명하는 책은 유일한 책이 아닌가 한다. 텍스트 패턴 매칭….. HTML 코드에서 어떻게 하면 양질의 정보를 뽑아낼까 하는 고민을 하는 요즘 나에게 정말 안성맞춤인 책이군…
계속 읽기당신의 나의 뜨거운 감자!
지난해 SW 불법복제 침해율 49.52%「1위는 알집」 대신 쓸수 있는거 많죠. 조금만 관심을 가지면 쓰실수 있습니다. 1. 빵집 (편리한 인터페이스, 한글) 2. 7-Zip (세부적인 압축 옵션을 선택할수 있고 엄청난(?) 압축률로 무장, 한글) 이 외에 많은것들이 있지만 … 젤 좋은게 이 두가지 같습니다. 근데 alz 포멧은 정말 싫어…
계속 읽기IE, 드디어 윈도우와「결별 선언」 그동안 브라우저 시장의 IE의 독점으로 배짱을 부리더니 “FireFox에게 단단히 물린거 같다. 본문중…. …데크렘은 “파이어폭스의 성공을 이보다 더 잘 확인할 수 있는 방법은 없다. 파이어폭스의 성공으로 MS는 IE를 개선할 수밖에 없게 됐다. 그저 이 발표가 행해질 때까지 너무 오랜 시간이 걸렸다는 점만이 유일하게 놀랄만한 부분”이라고 비꼬아 말했다…. 독점… 한가지만 사용하는거 …. 모든 […]
계속 읽기W3C HTML 추천 스펙 http://www.w3.org/TR/html401/ 이거의 번역본은… http://trio.co.kr/webrefer/html/cover.html 웹로봇 규약을 지키기위한 사이트 또한 각종 웹로봇에 대한 정보가 나와있음 www.robotstxt.org 2005년 2월 21일 추가
계속 읽기출처 : 검색엔진 개발자 그룹 웹 로봇(Web Crawler)개발을 앞두고 이래저래 준비하고 있는게 많은데 개발자 그룹 어떤 고수분이 올린글을 인용해 본다. 1. 웹로봇은 http 프로토콜규약에 의해 이루어지는 것이므로 쉽다는 생각은 금물. 2. HTML 태그 구조에 자신있는가? 웹프로그램을 해본적이 없이 어플리케이션 입장에서 접근한다면 반드시 실패. 3. 개발해서 어디다 써먹을것인가? 그냥 한번 만들어보고 싶다는 생각에서 테스트한다면 상관없으나 웹로봇으로 […]
계속 읽기이런 질문에…. 기존에 C로 되어 있는 Web Crawler를 Python으로 만들려고 합니다. 이유는 기존의 프로그램의 유지보수 어려움및 플랫폼 독립적이지 못한 부분때문에 그렇습니다. (어짜피 리눅스 버젼도 만들어야 된다구 해서요..) 아직 파이썬으로 다시 만들어 본다고 건의는 하지 않은 상황인데 내일 정도 할려고 합니다. 윗분들에게 파이썬의 장점을 어떻게 이야기 하면 수긍을 하실까요? 물론 Google의 웹 로봇도 파이썬으로 만들어 졌다는 […]
계속 읽기출처 : http://blog.naver.com/nutch.do 국내 검색사이트 네이버 엠파스 야후 구글 스카우터 서치코리아 지우(오픈 디렉트리 검색엔진) 자갸(PHP 색인어 추출기) FindBlog(블로그검색엔진) 다음카페 검색엔진 개발자 그룹 데모엔진 2005년2월4일추가 검색솔루션업체 다음소프트 자연어처리(NLP)기술을 바탕으로 한 검색솔루션 토크로(Talkro)IR를 통해 시장공략을 강화한다 이제품은 키워드와 자연어검색은 물론 사용자 의도까지도 파악한 결과를 내놓은 솔루션이다 다이퀘스트 통합검색엔진 ‘다이버’는 쇼핑몰 전문 솔루션인다. 일반 검색엔진은 ‘냉장고’라는 검색어로 […]
계속 읽기월요일부터 웹로봇을 맡게 되었다. 자바로 되어있는 코드 분석은 해봤는데 좀더 많은 정보가 필요해서 집에서 여러 정보를 찾아보면서 생각해 봤다. 자바로 되어있던것하고 현재 C로 만든 웹로봇과 비교해서 Crawling 속도 비교를 한적이 있었는데 자바 속도가 좀 빨랐던 기억이 난다. 역시나 언어 논쟁은 쓸데 없는짓이라는걸 이때 알았다. C보다 40배 정도 느리다는 JAVA인데… 정작 어플리케이션에서는 그리 차이나 나질 않고 […]
계속 읽기아직 국내 번역서나 국내 저자가 쓴 책뿐이 못봤다. 지금 보고 있는 책이 Python CookBook인데 음 뭐라 할말이 없다….. 책 보다도 http://aspn.activestate.com/ASPN 이 사이트를 더 많이 활용하는 편이라서. 그럼 일단 책 소개를 해보자! 1.열혈강의 파이썬 이강성 교수님이 지으신 책인데 정말 강추하는 책이다. 이책 3만원 조금 넘는데 지금까지 한 30만원 어치는 나에게 한거 같다. 앞으로 계속 옆에 […]
계속 읽기간간히 요즘 재미있게 하는게임이 Prince of Persia Warrior Within 작년 11월 말부터 했으니 꽤 했다.. 근데 여태 클리어를 못했다. 이걸하면서 뭣이든지 해결해 볼라는 그 프로그래머로서의 능력(?)을 한층 발휘하면서 즐겼었다. 퍼즐요소가 굉장히 많은 게임인데 공략집을 전혀 안보고 이 게임을 서서히 조금씩 클리어 하는걸 보고 나 자신도 뿌듯해질때까지 있으니… ㅎㅎㅎ 게임을 하다보면 항상 막히는 부분이 있다. 난 […]
계속 읽기