간단한 문자열 정규화 코드

사용자 입력 문자열에서 문장부호나 쓸데없는 문자들을 필터링 해서 필요한 문자열로만 만들고 싶을 경우가 있다. 뭐 이 작업을 정규화 작업이라고 한다면 아래의 간단한 처리 만으로 숫자와 다양한 언어 문자열들만 포함하게끔 만들어줄 수 있다. 유니코드 카테고리중에서 숫자(Number)인것들과 문자(Letter)인것들만 허용해 string을 만들어 주는 함수이다. 물론 인자는 유니코드 문자열이여야만 한다.   from unicodedata import category def norm(word): return u"".join([c […]

계속 읽기

암담한 상황에서 빛을 보다.

최근 들어서 이런 저런 대 내외적인 사건들이 많은 관계로 나 자신, 그리고 내 일에 대한 생각을 많이 해보는 시간을 가지게 되었다. 물론 나만의 문제가 아닌, 이런 대,내외적인 변화로 인해 영향을 받는 나로서는 참 힘든 고민들이 아닐 수 없었고, 그 와중에 어느정도 행동 방침을 정하였고, 그럼에도 불구하고 어지러운 마음을 추수르기 위해 하릴없이 아두이노나 알고리즘 책을 보거나,혹은 […]

계속 읽기

박지성 선수를 보면서 “아웃라이어”를 생각했다.

박지성의 플레이를 보면서 계속  "아웃라이어"라는 책 내용을 생각했다.  그 사람의 성공에는 그 사람이 성장한 환경이 가장 큰 영향을 미친다는거.. 그리고 속담 하나… 사람은 서울로 보내고 말은 제주도로 보내라는..ㅋㅋ 물론 김연아처럼 척박한 국내 피겨 환경에서 자라서 세계를 재패한 경우도 있다. 하지만 이는 정말 아주 작은 확률이라고 생각한다. 박지성처럼 축구에 타고난 신체 조건과 재능이 많지 않음에도 불구하고 […]

계속 읽기

Facebook Puzzle 풀기

주말에 faebook 퍼즐을 풀어 봤다. 연습문제로 평가 로봇이 어떻게 동작하는지 확인 한 다음에… 한문제 한문제씩 풀고 있는 찰라… 정확한 계산값이 나왔는데도 로봇이 reject을 하는 경우가 발생했다. 문제는 바로 아래의 문제인데.. http://www.facebook.com/careers/puzzles.php?puzzle_id=17 뭐 문제를 읽어보면 알겠지만 사전 하나 주어지고, 이 사전을 가지고 최소의 edit distance를 구하는 문제였다. edit distance 구하는건 눈 감고도 하는 경지가 다다른 바.. […]

계속 읽기

Arduino나 해볼까?

인사이트 출판사에서 새로운 책이 나왔다길래 이게 뭘까 하고 둘러보다가 아두이노 키트까지 구매해 버렸다. 그리고 아래와 같이 hello world 류의  프로그램도 돌려봤다. 어떤 저항이 적절할까 계산해서 넣어주고.. 사실.. 필요한 저항이 키트에 없긴 했다. 그래서 그냥 가장 가까운 저항을 넣어 줬더니 잘 돌아가긴 한다. 아두이노의 아날로그 슬롯에 3개의 led를 병렬로 연결하고 각각 led의 밝기를 조절하는 예제인데, 딱 […]

계속 읽기

오픈마루 스튜디오 마지막 글을 보며..

개인적으로 오픈마루 초창기 한창 사람을 뽑고 있을때 채용과정을 끝까지  경험한 적도 있고, 그에 따라 관계자 분들을 만나보며 이야기도 많이 했던 경험이 있다. 그리고 무엇보다 구글 스러운 채용 과정은 참 곤혹스럽게 했지만 재미도 있었다고 생각한다. 그래서 그 회사 직원은 아니였지만 관심 있게 봐왔던 회사중에 하나였다. 그런데 오늘 오픈마루 스튜디오의 마지막 글이 올라온것을 보게 되었다. 개인적으로 이런 […]

계속 읽기

introduction to information retrieval 번역서

전혀 기대하고 있지 않았는데, 3월달에 이 책의 번역서가 나왔다는 것을 오늘 알았다. 그래서 바로 주문하고 몇 챕터 확인 후 포스팅을 써본다. 야후 웹검색, YST라고 불리우는 기술이 현재로서는 MS로 대부분 넘어간 상태지만 그 전에 이 책이 나오게 된것을 상당히 다행스럽게 생각하고 있다. 알고 있는 분들이 이미 있겠지만 이 책의 공저자중에 한 분이 야후 리서치를 책임지고 있는 […]

계속 읽기

김상형씨의 ‘안드로이드 프로그래밍 정복’ 리뷰

안드로이드 프로그래밍 정복 한빛 출판사 리뷰용 서적을 받아보고 이제야 리뷰를 블로그에 올린다.(너무 늦어서 누가 되지 않을까 고민이다. ) 지금까지 나왔던 번역서 위주의 국내 안드로이드 프로그래밍 서적과는 다른 집필서라는 점이 가장 눈에 띈다. 게다가 한 2/3 정도 읽어본 소감으로 역시 국내서라는 장점을 아주 잘 살린 여러 팁들이 있다는 것인데 특히 앞부분 안드로이드 개발 환경 설정시 한글문제 […]

계속 읽기

흉내내기 힘든 인간 지적판단과 지능형 소프트웨어

요 데이터마이닝 관련 프로젝트는 많은 소프트웨어 개발자들이 느끼는 개발자 자신의 겸손한 자세를 요구하는것과 더불어 인간 지적판단의 위대함을 다시한번 느끼게 해주는 몇 안되는 프로젝트이다. 많은 소프트웨어의 버그 해결 과정은 깊은 자기 반성의 시간이 된다. 자신에 대한 확신이 강한 사람은 심지어 컴파일러까지도 의심하지만 대부분의 경우 본인에게 문제가 있다. 이런 과정이 반복되고 경험이 쌓이면 개발자 자신이 자신에 대해서 […]

계속 읽기