야후는 왜 얼음집을 좋아하는걸까요?

지민아빠님의 글을 읽고 써본다. 솔직히 여름이여서 얼음집이 인기가 좋다. 라고 말하기에는 좀 썰렁하군… ^^; 나도 왜 순위가 높은지 말해주고 싶어서 입이 근질거리는 찰라다. 사실 이 문제에 대해서 내부적으로 많은 이야기가 나왔었다. 몇가지 이유를 댈수 있겠지만 이글루스라는 서비스 자체 사용자들의 블로그 스피어에 대한 기여도가 높아서 신뢰도가 높다는 정도로 말씀 드린다. (아마도 더 자세한 이야기는 추후 열릴것이라 […]

계속 읽기

야후 코리아 블로거 랭킹

예전에 Platformday에서 블로그 서비스에 Webmap을 사용하고 있다는 말을 한적이 있다. 그리고 그것에서 파생되어 나오는 여러 서비스(?)가 어떤것이 될것인지 살짝 언급을 했었다. 바로 내 블로그 우측하단에 있는 뱃지가 그 결과물중에 하나이다. 972 이미 typos 형님이 이 부분에 대해서 잠깐 언급을 하고 계신다. 위 랭킹이 기존의 블로거 랭킹과 다른점이라면 Machine Learning 알고리즘에 의해서 나온 결과라는것이다. 이전에 올블이나 […]

계속 읽기

랭킹 비교 함수

어떤 데이터셋의 나열에 대한 비교를 수행할때 Correlation을 많이 사용한다.이전에 inlink 카운트와 인덱스된 페이지의 갯수에 대한 분석을 Correlation을 이용해서 했는데 이 식은 그런 경향성을 분석하는데 유용하게 쓰일 아주 중요한 식이다. Pearson correlation 일반적으로 Correlation이라고 함은 Pearson Correlation을 지칭함을 의미한다. 그리고 이 Pearson Correlation은 랭킹을 비교할때 쓰이는 Spearman’s rank correlation coefficient 같은 특수한 식의 기본 개념이 된다. […]

계속 읽기

모두 축하해 주셔서 감사합니다.

내 블로그 사상 최다 덧글과 많은 전화 그리고 문자들… 자고 있다가 받았지만 멀리 미국에서 직장동료분께서 주신 축하전화 … 너무 많은 축하를 받아서 몸둘바를 모르겠다. 축하주심에 너무 감사드립니다. 블로그에 있는 축하 덧글은 하루에도 수 번씩 보게 되네요.  일일이 덧글을 다는것도 구차해 보여서 이렇게 포스팅으로 대체 합니다. 감사합니다. 

계속 읽기

아빠가 되었습니다.

어제 저녁 36시간의 진통끝에 3.8kg의 소중한 아들을 얻었다. 아래 사진은 태어난지 24시간이 넘어서 찍은 사진인데 엄마 뱃속에서 이발까지 하고 나왔나 할 정도로 머리 정돈이 잘 되어 나왔다. 예만 보면 왜 마시마로 생각이 나는지 모르겠다. 쩝~ 결혼이라는 경험과 아이를 낳는다는 경험은 비슷한 범주 내의 경험이지만 무엇보다 아이를 낳고 키우는 경험은 그동안의 나를 돌아보는 중요한 계기가 되는거 […]

계속 읽기

칼럼을 쓰자!

예전에 IBM Developerworks에 굉장히 특이한 칼럼을 쓴적이 있었다. 주로 개발 관련 소프트웨어에 대한 글이 주를 이루고 있는 웹진인데 겁도 없이 수식을 들이대고 스팸 필터링 관련 Machine Learning 칼럼을 기고한 것이다. 그러고나서 한번의 질문도 제대로 받지 못했고 한분을 제외하고는 칼럼에 대한 피드백을 받아 본적이 없었다. (사실 대중성이 없는 주제기도 하다. ) 그러다 어느날 어느 유명 검색포털에 […]

계속 읽기

Hanrss와 Site Explorer

일전에 Hanrss top 1000 블로거를 추출해 본 적이 있었다.반응이 좀 좋았는데, 이번에는 구독자수를 입력해봤고, 게다가 Yahoo! Site explorer의 데이터도 뽑아서 넣어 봤다. Site Explorer 에서 해당 url의 inlink count와 해당 주소의 sub url의 갯수를 알수 있다. 그것도 힘들게 html 파싱같은거 하지 않아도 말이다. 이 부분에 대해서는 Yahoo! Site Explorer API를 참고하길 바란다. 사실 내 의도는 […]

계속 읽기

왜 Machine Learning을 사용하는가?

작년 언젠가 회사 PD분이 위 질문을 했다. 아마도 그때 답변은 미지의 데이터에 대해서 학습된 데이터를 기반 예측을 해서 자동으로 어떠한 처리하기 위해 ML을 사용한다고 한거 같다.쩝~ ML 공부만 하고 실무는 전혀 안해본 샌님이나 할 수 있는 대답이다. 오늘 분류데이터를 분석하면서 왜 ML을 사용해야 하는지 정말 절절하게 깨달았다. 이 느낌은 이전에 스팸관련 논문을 쓰면서 ML실험을하는 과정에서 […]

계속 읽기

간만에 악기 연주

어제 마눌님이랑 이산을 보다가 잠깐 방에 들어가서 어제 저녁에 야후 본사 Research 팀 박사님이 보내준 나의 질문에 대한 답변의  코드 분석을 하고 있었다.거실에서 이산의 마지막에 흘러나오는 테마곡 장윤정 – 약속 이라는 노래가 흘러나왔는데, 갑자기 이 노래를 오카리나로 불러보면 꽤 잘 어울릴거 같다는 느낌이 들었다. 그래서 바로 악보를 찾아봤고 그 악보를 보고 즉석으로 주제곡을 연주해 봤다. […]

계속 읽기

Yahoo! Research팀의 도움을 받아서…

3일동안 고민하고 코딩하고 테스트하고를 반복 하다가 결국 사내 machine learning 커뮤니티에 질문을 던졌다.미국시간으로 새벽에 메일을 받았을텐데, 어느 마음씨 좋은 Yahoo! research팀의 scientist분이 답변을 주셨다. 내 짧은 메일의 내용을 200% 이해하고 있었으며 정확하게 핵심을 짚어서 답변을 해주셨다.답변보다 놀라웠던점은 내가 하는 작업과 알고리즘에 대해서 훤히 들여다 보는 그 혜안이였다. 그분이 통한건지 내가 통하게 질문을 했던건지…..쩝 사실 그동안 […]

계속 읽기