클라우드 컴퓨팅의 숨은 파워 ‘하둡’ – eWEEK 기고문
저작권이 eWEEK와 내가 공동으로 가지고 있는 것이라 공개를 해본다. 내용은 이전 platformday 2008에서 발표한 내용과 큰 차이가 없다. 회사 홍보팀 부탁으로 쓰게 되었는데 잡지 성격이 일개 개발자가 감당하기 힘들더라. 아무튼 이곳에 전문을 공개한다.
계속 읽기당신의 나의 뜨거운 감자!
저작권이 eWEEK와 내가 공동으로 가지고 있는 것이라 공개를 해본다. 내용은 이전 platformday 2008에서 발표한 내용과 큰 차이가 없다. 회사 홍보팀 부탁으로 쓰게 되었는데 잡지 성격이 일개 개발자가 감당하기 힘들더라. 아무튼 이곳에 전문을 공개한다.
계속 읽기머신런닝을 이용한 분류기를 만들때 가장 많이 나오는 유명한 개념중에 하나이다. 분류기를 만들어서 테스트 하는 과정을 거치며 많은 에러들이 나오게 된다. 이런 에러들을 MSE로 분석해보면 Learning Error = bias + variance 위와 같은 식으로 간단하게 정리된다. Bias는 학습된 분류기와 실제 값 사이의 제곱에러이다. 정확도하고 약간 비슷한 개념이다. 이 bias는 linear한 분류기보다 nonlinear한 분류기가 낮은 값으로 나온다. […]
계속 읽기Google “We need more Korean developer” …Lois Kim said “We do not concern extending contents with TNC’s, but mainly concern on making better R&D capability with TNC developer.” “It’s not yet decided blogging service will be started with TNC.”…… On Google’s view, TNC was not a blog platform company, but headhunting company with good developer […]
계속 읽기오라일리에서 통계에 대한 두가지 책이 나왔다. 첫번째는 Head First Statistics책인데 아마존에서 주문한지 하루만에 한빛 미디어에서 수입했다고 메일 공지가 오더라. (벌써 shipping이 되었다고 해서 취소도 못하는 상황이다. ㅜㅜ) 게다가 더불에 Statistics in a Nutshell 도 나왔는데 한 출판사에서 컴퓨터관련 서적만을 취급하는 두가지 시리즈 모두에 통계라는게 나왔다는건 큰 의미가 있다고 생각한다. 여튼 성격이 다른 두가지 책을 모두 […]
계속 읽기8월 마소잡지에 Erlang으로 Map/Reduce 프레임웍을 만드는 예제로 만든적이 있었다. 이 글 이후에 외부 스크립트로 Python을 사용하는 포스팅을 쓴적이 있었다. 사실 위 글은 내가 만든 map/reduce 프레임웍에서 Python 외부 스크립트를 사용하기 위한 방법을 고안하기 위해 했던 작업의 일환이였다. 그러나 내가 생각했던 수준보다 더 많은 고민을 한 오픈소스 프로젝트가 얼마전에 공개되었다. 좀 촌스러운 프로젝트 이름인지 몰라도 Disco […]
계속 읽기“광고를 먼저 생각하기 전에 당신 제품의 퀄리티를 늘려라.”(그림 출처) 많은걸 생각하게 하는 그래프인거 같다. 더 생각해 보면, “광고를 많이하는 제품일수록 퀄리티는 떨어질 수 있다” 고도 할 수 있겠군. 의심의 여지가 있는 제품이란 말이지. 그래프를 기반으로 1. 광고를 많이해서 매출이 늘었다.2. 제품 퀄리티를 좋게해서 매출이 늘었다. 위 두가지 케이스가 항상 같은 결과를 가져올까? 순간적인 초기 매출은 […]
계속 읽기오늘 12시 TNC블로그에 대박 소식이 떴다. 앞으로 텍스트큐브를 사용하는 블로거로서 구글의 리소스를 활용한 스팸필터 업그레이드라든지 추가될 기능들이 매우 기대된다. (textcube.org의 가장 큰 스폰서는 구글이 되겠군.)그리고 구글이 그리고 있는 로드맵에서 텍스트큐브가 한몫 하기를 진심으로 기대한다. 개인적인 생각으로는 벤처하기 힘든 우리나라에서 구글에게 기술력을 인정받은 이런 벤처기업이 나왔다는 사실이 정말 기쁘다. 예전에 Eolin에서 구글에 데이터를 제공한다는 소문이 있어서 […]
계속 읽기하루만에 기고문이 엄청나게 쌓일 수 있는 경험을 화요일날 했다. 수요일날 휴가가기 전에 요청을 해주시는 절묘한 타이밍… 하나는 기고와 더불에 인터뷰 요청인데 야후 클라우드 컴퓨팅에 대한 요청이였다. 하지만 아직 클라우드 컴퓨팅 기술의 외부 공개에 대한 가이드라인을 명확하게 알지 못하는지라 그런 부분에 대해 확인할 수 있는 시간을 주지 않으면 힘들다는 요청을 했고 결국 10월달 잡지에는 올라가기 힘들게 […]
계속 읽기TBB를 사용해서 Matrix연산 퍼포먼스를 측정해 봤다. Matrix Multiply를 해봤는데 그런대로 볼만한 성능향상이 있어서 그 내용에 대해서 올려본다. Matrix 곱 연산은 N X N 두개의 행렬에 대해서 실행 했을때 O(n^3)이 나오는 복잡한 연산중에 하나이다. 게다가 매트릭스 곱은 행과 열의 관계에 대한 계산을 할때 빈번히 쓰여서 social network를 구현하기 위한 계산을 할때 자주쓰이는 재밋는 수식이다. 이 연산비교를 […]
계속 읽기최근 멀티코어 프로그래밍을 좀더 심화시켜 보기 위해 Intel Threading Building Blocks 라는 오라일리에서 나온 책을 보고 있다. 책을 구입한지는 꽤 되었지만 그동안 배경지식이 별로 없어서 덮어두고 있다가 최근 틈틈히 봐서 반 이상은 본거 같다. 이 책을 보면서 느끼는건 저자가 어렵게 쓴 책을 보면서 원망을 많이 했었던 것이 시간이 가면 갈수록 경외감으로 바뀌어 간다는 것이다. 하지만 […]
계속 읽기