PageRank와 확률론

Google’s PageRank and Beyond를 보는데 역시나 선형대수학을 넘으니 이제는 확률론이 발목을 잡는다. 확률론은 기초적인 부분만 알지, 여기서 나오는 마르코프 체인 같은 부분은 잘 모른다. HMM에 대한 공부를 해봤지만 여기서 쓰이는 부분에 대한 지식이 없어서 마르코프 체인의 수렴 조건에 대한 이해를 잘 하지 못하고 있다. 그래서 책을 잡았다. (하지만 책도 마지막 쳅터에 이걸 다루고 있다는.. ㅡㅡ;) […]

계속 읽기

수학에서 쓰는 기호 정리

내가 정리한건 아니고 예전에 정보검색책을 볼때 어디선가 찾은건데, 출처가 생각이 안난다.(원작자에겐 정말 죄송합니다. 나중에 보시고 누구라고 뎃글이라두 달아주시면 고맙겠습니다. 바로 링크 걸겠습니다. ^^;) 바탕화면에 두고 계속 보고 있다가 이걸 블로그에 올려 놓으면 좋을거 같아서 올려본다. 물론 나의 편의를 위해서지만 말이다. 원문을 그대로 넣었다. 따라서 첫부분의 저작자 분 생각도 함께 넣었다. 제가 보기엔 모두 다 수학기호 […]

계속 읽기

프로그래머가 경계 해야할 것이 무엇이 있을까 ?

김정은님의 글에 대한 트랙백 1) 자만심은 금물 훌륭한 분들이 많은 회사가서 부딧쳐 보면 세상 넓고 고수는 많다는 느낌을 확~ 받게 된다. 하지만 절대 주눅들지 말고 자신감은 잃지 말아야 겠다. 자신이 그 고수만큼의 경력을 쌓는다면 더 훌륭해 질꺼라 생각하자. 2) 완벽한 프로그래머는 없다. 자신의 잘못이라 말 할 수 있다는 것은 자신을 더 발전 시킬 수 있다고 […]

계속 읽기

code reading

약 1년전만해도 남의 소스 코드 보는걸 굉장히 싫어 했다. 물론 지금도 처음 보기 시작할때는 정말 고통의 연속이다. 눈이 충혈되고, 짜증도 나고….. 쩝 그러다 때려 치기를 여러번, 드디어 고지를 점령했을때 그 느낌… ㅎㅎ 지금 이래저래 소스코드 뷰를 굉장히 많이 하고 있긴 하다. 그러면서 코드 리딩에 관한 책도 하나 발견해서 보고 있는데. code reading : 오픈소스 관점에서 […]

계속 읽기

BigTable의 Tablet Serving과 Compaction 그리고 Lucene의 Incremental Indexing

김형준님의 강의를 바탕으로 논문을 보고 있는데, 강의 들으면서 낯설지 않은 부분이 Tablet Serving과 Compaction 부분이였다. 한번 정리해 본다. 논문에 나온 그림 새로운 데이터가 들어올때. BigTable의 DB 무결성을 유지하기 위해서 메모리기반의 버퍼를 유지하고 또한 그 버퍼의 Copy를 이용해서 계속 서비스를 유지하게 하면서 minor compaction을 수행한다. 물론 minor compaction이 완료가 되면 메모리를 지운다. 그 강의에는 나오지 않았지만, […]

계속 읽기

Google BigTable에 대한 번개 세미나

오늘 typos님이 주최하신(?) 비공식 BigTable 모임에 참가를 했었다. 이 모임에 맨주먹 불끈쥐고 참가할 수 없어서 잠깐 BigTable논문을 어제 학교 다녀오면서 쬐금 봤었는데 수박 겉핧기로 알고 자리에 참석을 했다. (시간이 없다는 핑계~~~ ㅡㅡ;) XXW0t8lzhe.pdf 한 두어시간 정도 B.T.B 맥주집에서 typos님과 나와, 이름을 밝힐 수 없는 어느분과 http://jaso.co.kr의 운영자이신 김형준님과 함께 자리를 함께 했다. 주로 검색쪽보다는 대용량 […]

계속 읽기

ThinkWise5.0 구매

ThinkWise5.0을 구매했다. 6만6천원으로 말이다. 이 프로그램을 3년 전부터 심심치 않게 써왔는데 생각 정리하는데 탁월한 기능이 있다는걸 중학교때부터 알아온지라 (토니부잔의 마이드맵 이라는책에서) 결국 구입하고 말았다. 외산 툴도 있지만 이게 더 인터페이스가 더 좋고 한글에 최적이라는 판단 그리고 국산이라는 애국심도 작용을 했다. 솔직히 이 프로그램의 크랙을 많이 찾아봤지만 찾지 못했던 이유를 알았다. 라이센스를 굉장히 세심하게 관리를 하고 […]

계속 읽기

Lucene을 쓰고도…

자신의 검색기술에 Lucene이 기반이 되는데도 그에 대한 말 한마디 없는 사람들 참으로 대단하다는 생각이 든다. 게다가 한술 더떠서 자신의 업체가 검색기술력이 있다고 미디어에 떠들고 다닌다. Lucene을 쓰면서 Lucene의 장점과 단점을 속시원히 말씀하고 다니시는 분들이 있는가 하면, 미디어에 Lucene이 자신의 기술인양 뻥을 치는 곳을 요즘 부쩍 많이 본다.(그런곳은 절대 Lucene을 쓴다는 말을 안한다. ) 무엇보다 가장 […]

계속 읽기

Information Retrieval Algorithms and Heuristics

Information Retrieval Algorithms and Heuristics 이라는 책을 주문을 한지 보름이 다 되어 가는데 이제야 도착했다. 오늘 도착 할 줄 알고 그동안 보던 1판을 반납하려 가져와서 두 책의 비교를 목차를 통해 해봤다. 눈에 띄게 달라진건 2판이 Cross-Language Retrieval Syatem, p2p Retrieval Syatem 등의 업계에서 관심을 두고 있는 검색에 대한 챕터가 추가된 부분과, 검색모델 부분에서는 Language Model […]

계속 읽기