Programming Erlang

몇일 전부터 erlang tutorial을 보면서 코드를 치고 놀다가 아침에 출근하자 마자 책을 주문해서 오후 늦게야 받았다.(원서를 주문한지 하루만에 받아보긴 처음이다.) Programming Erlang이라는 책인데 요즘 꽤나 잘 나가는 책인가 보다. 강컴이나 yes24의 원서 코너에서 상당한 판매량을 자랑하고 있으니 말이다. 뭐 말만들어본 함수형 언어를 처음 접해보는거라 좀 어색하긴 하지만 나름 흥미롭게 보고 있다. 목차를 보고 책을 빨리 […]

계속 읽기

D vs Ruby

블로그 스피어에서 어떤분이 D와 Ruby에 대한 비교글을 써놓았다. 이런 비교가 가능하다니 이 블로그 주인 참 재미있는 사람인거 같다. 내가 그 분의 글에 대해 약간의 견해를 비추기 위해 글을 써본다. 알다시피 D와 Ruby는 태생 목적 자체가 다른 언어이다. D는 생산적인 시스템 프로그래밍을 위해서 나온 언어이고, Ruby는 프로그래머에게 재미를 주는 프로그래밍을 위해 나온 언어이다. 그래서 D에서는 기존에 […]

계속 읽기

보름동안 블로그에 걸린 스팸 ip들

스팸 ip 모은거 올려본다. 저번에 3위를 하던 놈이 1위로 등극했고, 2위 하던 놈은 부동의 2위 자리를 고수하고 있다. 그럼 1등하던 ip는 어딧나???역시나 영원한 1등은 힘든것인가? 파일 첨부합니다. XUQhkgDLu7.xls ps. 목록을 블로깅 툴에 어느정도 등록(스팸ip로)시켜 두면 여러모로 괜찮을거 같기도 하다.

계속 읽기

Spam서버 저장 구조 관련

현재 논문과는 별도로 실제 Disk Based Hash를 구현했다.(진행중??) 이것의 속사정은 이렇다. 3만여건의 comment를 training하는데 무려 3시간이 넘는 시간이 필요했기에 테스트의 역동성을 위해서 구현을 해버린 것이다. 왜 3시간이냐? 하고 묻는다면,  pos tagger를  헤집어볼 시간이 없어서였다. 이것의 입출력 인터페이스를 위해 무려 3번의 파일 writing을 해버리는 무지막지한 병목을 만들어 버렸다. 결국 어떻게든  파일 기반 해슁을 만들어 버렸으니… 쩝… […]

계속 읽기

Yahoo!에서 Hadoop이 어떻게 쓰일까?

야후에서 직접 Hadoop이 내부적으로 어떻게 쓰이는지 공개 했다. 뭐 쓰임새야 야후직원이고 평소 관심이 많아 알고 있었던 사실이고 직접 써보기 까지 했으니… 내부 자료인데, 적당한 레벨에서 공개를 한거 같다. 실제 Hadoop에 대한 소개글 수준인 Doug Cutting의 ppt 보다 Eric의 ppt가 볼만하다.왜냐면 실무에서 어떻게 사용이 되는지 간단하게 나마 소개되어 있기 때문이다. Hadoop at OSCON Yahoo!의 Hadoop cluster […]

계속 읽기

금일 모 언론사 컨설팅(?) 내용

어제 교수님과 식사겸 논문 세미나를 했는데, 국내 모 언론사에 다니시는 대학원 원우님께서 나의 논문주제에 이번에도 상당한 관심을 보이셨다.그런데 아니다 다를까 오늘 전화를 하셔서 많은 내용을 물어보셨다. 문제는 덧글 스팸에 대한건데, 요즘 이놈이 글을 읽는데 상당한 재미를 제공해 주기도 하지만 그와 반면에 엄청난 스팸이 달려서 이것때문에 골치가 아프다는 말씀을 하셨다. (요즘 악플도 문제다. 그 종교문제로 인한….) […]

계속 읽기

알고리즘 좋은 사이트들

개발자로서 algorithm과 data structure를 항상 염두에 두고 개발을 해야하고 문제 해결을 위해 어떤것을 사용해야 할지 고민을 하는것은 필수라고 생각한다. 개발자로서 대량의 데이터를 처리할시 알고리즘을 조금 손보고  엄청난 퍼포먼스 향상이 있었던 경우를 겪어본 분들은 분명 공감하리라 생각한다. 자신이 잠시동안 이러한 것들에 대해서 잊고 살았다고 생각하는 분들은 강좌를 찾아보는 방법도 괜찮은 방법이라고 생각한다. 찾아보면 여러곳에서 알고리즘 강좌를 […]

계속 읽기

푸코의 진자에서 순열 문제가….

어제 오늘 그동안 시간이 없어 미뤄두었던 움베르트 에코의 “푸코의 진자“를 정말 흥미롭게 보고 있다. 보면서 카소봉라는 주인공으로 사료되는 인물이 벨보의 컴퓨터의 암호를 알아맞추는 과정에서 프로그래밍을 해서 순열을 구하고 그 순열의 나열 순서에 따른 답을 입력하는 부분이 나온다. 책에서는 Basic프로그램으로 4개의 char의 경우에 대한 프로그래밍 예제가 나오고 그것을 이용해서 카소보가 permutation 프로그래밍을 하는 대목으로 이어지는 것이다. […]

계속 읽기

D language community에서 어떤 고수가 쓴 글

어떤 D Language user가 D community에서 D language로 밥벌어먹을 수 있느냐? 하는 질문에 어느 고수 개발자가 답글을 달았다. 읽어보는데 구구절절 개발자의 특정 언어 선호에 대한 따끔한 질책을 느낄 수 있었다. …..Don’t become a D programmer.  Don’t become a C++ programmer.  Don’t become a C# or a Java programmer.  You really don’t want to become a […]

계속 읽기

endian 변환 모듈

주말에 서버를 개발하다가 아래와 같은 메서드가 없어서 고민을 하다가 만들어 버렸다. uint32_t htonl(uint32_t hostlong); uint32_t ntohl(uint32_t netlong); D language에서는 위와 같은 메서드를 찾아볼수 없고, 유저 게시판에서도 못찾아서 만들어 버렸는데, 꽤 쓸만하다. 네트워크상에서는 Big-endian을 쓰니 LittleEndian에서만 문제가 생기더라. 그래서 아래와 같은 모듈로 두 메서드를 대체해 버렸다. [CODE c]import std.system; uint htonl(uint hostlong){    ubyte[4] retbyte;    […]

계속 읽기