Google의 MapReduce 와 Hadoop

오늘 businessweek지에서 상당히 흥미로운 기사를 봐서 포스팅 해본다. The Two Flavors of Google 이라는 글인데, 요즘(?) MapReduce기술을 기반으로 각광 받고 있는 cloud computing 분야에서 두가지 기술적인 조류를 이루고 있는 Google의 mapreduce와 Hadoop에 대해서 이야기 하고 있다. 이 글을 보고 Hadoop이 구글의 기술을 99% 배껴서 만들어 졌다는 편견을 말끔히 해소할 수 있었다. 구글에서 Hadoop에 컨트리뷰트 하고 […]

계속 읽기

야후 무료백신이 나왔군요..- 사용기 –

무료백신이라면 갠적으로 고려대학교와 라이센스 계약이 맺어진 안철수 연구소의 유료 백신을 써왔다. 불편함은 없었으며 심하게 많은 파일을 P2P에서 다운로드 받아서 프로그램을 실행하지 않는 일반적인 개인 유저입장에서 봤을때 크게 불편없는 백신이라 생각한다. 그 뒤로 알약이 배포되어 알약을 주로 쓰고 있었으며, 이것도 또한 무료 실시간 감시 기능이 있는 백신 치고는 참 괜찮은 백신이라 생각했고 또한 실제 크게 불편함이 […]

계속 읽기

개발자 커플이라서…

어제 대학원 연말 모임이 있는 관계로 여자친구를 일찍 불러서 모임에 갔다. 요즘 여자친구가 무척 바쁜데도 불구하고 말이다. 그래서 어제의 업무 여파로 인해 오늘 여자친구는 출근을 하고 나는 학교에 와서 논문 점검을 하고 있다. 그런데.., 여자친구한테 msn 로긴하라는 연락이 오고 접속해서 디버깅 임무를 부여 받았다. ^^; 오늘 저녁에 또 모임 비슷한게 있는데, 같이 그곳에 가려면 어쩔수 […]

계속 읽기

기다리던 E-Book Reader 소식 – 소리북

기다리고 기다리던 소리북 소식이다. 아래와 같은 사양과 일정으로 예판을 시작한다고 한다. 개정된 자세한 스팩은 이곳에서 확인이 가능하다. 솔직히 운영체제가 win CE 계열이라면 꽤 좋은 확장성과 안정성을 가질것으로 생각하고(다만 베터리 문제는 좀….걱정이 된다.), 그에따른 가격 상승의 요인이 있었을 거라 생각한다. 솔직히 요즘 논문 pdf를 보는 습관을 들이려고 많은 노력을 하고 있는데, 저런 기기 하나 있으면 참 […]

계속 읽기

에드센스를 달았어요.

뭐 달았다고 자랑할것은 아니지만, 얼마전 트래픽 다운 사태를 겪고 나서 금전적인 보조를 받고 싶은 생각이 굴뚝같아 지는 바람에 일을 저질러 버렸다. 이전에 좋은 블로그들이 광고로 뒤덮히는 꼴을 많이 봐왔던지라 블로그에 광고하는거 싫어 했는데 눈살 찌푸리지 않을정도로만 광고를 설정했다. 다만 방문하시는 분들이 불편없으면 하는 바램이다.

계속 읽기

Learn to Win.

주말에 저녁에 시간내어 잠시 들른 서점에서 확 끌린 책이다. 잠시 속을 둘러보고 있자니 내 공부방법과 비교도 해 볼 생각으로 저자와 대화를 나누려 한권 구입했다. 크게 다르지는 않았지만 식사법까지 컨트롤 할 정도로 저자는 굉장한 공부 광이였다. 이 책에 첫부분 “1장 인생은 공부한 사람만이 승리한다.” 챕터를 너무 열심히 봐서 아침부터 여자친구하고 이런저런 이야기까지 했었다. 벤자민 프랭클린이 이런말을 […]

계속 읽기

SVM을 이용한 스팸 블로그 분류 논문

요즘 여러 외국 학술대회에서 스팸 블로그 관련 문서들이 쏟아져 나오고 있어서 참 재밋는 논문을 많이 보고 있다. 그중에서도 Detecting Spam Blog: A Machine Learning Approach의 논문을 요며칠 저녁에 잠깐 보고 오늘 몇몇 관련 자료를 찾아봤는데, 참 재미있었다. 이 논문에서 Spam Blog Detection을 하는데 중요한 local feature와 link feature가 함께 서로 보완되어서 쓰여야 한다고 이야기 하고 […]

계속 읽기

학습 코퍼스

항상 뭔가 대학에서 실험을 하든지간에 가장 힘든 부분이 학습데이터 수집하고 분류하는 작업일거란 생각이 든다. 그래서 산학 연계측면에서 기업에서 학습 코퍼스를 제공하는 경우가 있는데 그런식으로 제공이 된 학습 코퍼스가 아닐까 한다. web spam challenge 내가 알기로는 위의 데이터가 야후 리서치랩에서 공개가 된것으로 알고있는데 상세한 것은 잘 모르겠다. ^^;아마도 웹 스팸에 대해서 연구하는 분들에게는 정말 필요한 자료가 […]

계속 읽기

학습 전략

학습이라고 해서 공부하는걸 의미하는건 아니고 Machine Learning에서의 학습을 의미한다. 나도 처음에 그랬지만 ML학습하는 과정을 아래와 같이 수행을 하곤한다. 대부분의  ML 초심자들도 마찬가지라 생각한다. 1. 분류하고자 하는 문서정보를 입력 데이터 형식으로 변환한다.2. 분류기의 파라메터 값을 랜덤하게 선택해서 학습을 시킨다.3. 테스트 해보고 가장 좋은 파라메터를 선택한다. 위의 과정에서 가장 문제시 되고 있는것이 바로 학습기의 파라메터인데 이 부분에 […]

계속 읽기

논문 수정 사항 수정 후

논문 수정 작업 후 교수님께 도장 받고 교수님하고 이런저런 이야기를 했다. 1. 공부 더 할 생각 있냐? 2. 영어로 논문 써라. 공부더 하라는 말씀은 바로 박사과정 이야기 하시는거 같다. 물론 박사과정을 밟을 생각은 있지만 지금은 아니라고 생각한다. 석사논문을 써보고 하면서 충분히 혼자서도 이제는 실험하고 결론을 낼 수 있을만한 연습은 했다고 생각한다. 이제 중요한건 창의적인 사고력하고 […]

계속 읽기