구글 엔지니어에게 물어본것들

좀 오래(?) 전 이야기를 해보고자 한다.

한때 MapReduce니, GFS니 등 구글 기술에 관심이 많았던 때가 있었는데, 마침 구글직원을 만나서 논문을 보면서 궁금했던 것을 직접 물어볼 기회가 있었다.

질문들이다.

1. GFS에서 서버가 추가될때 데이터 레벨링이 어떻게 이루어 지는가?(논문에 자세한 내용이 나오지 않았다.)

답 : 5년전 페이퍼라서 지금 쓰는 구조와는 많은 차이가 있다. (답변을 하는 사람의 우월감을 느낄수 있었다. ㅜㅜ) 기존의 서버 자료를 복사해서 레벨링을 하지 않고 새로운 서버에 데이터를 저장해서 기존의 데이터와 레벨링을 맞춘다.

2. Mapreduce paper를 봤는데 이것을 Gmail에서는 어떻게 쓰고 있나?

답 : spam sniping을 하는데 쓴다.

질문 : 그럼 모든 스팸 처리를 개인화 하지 않고, 집단으로 처리한다는 말인가?

답 : (어렵사리…) 그렇다. ㅡㅡ;

스팸처리를 집단으로 처리한다는 이야기를 듣고 나는 약간 의아했다.

몇일전에 platformday2007을 하면서 구글의 기술에 대해서 많은 언급이 있었지만 그곳에서 발표하시는 박사님이 공개가 안된 부분에 대해서 많은 추측을 하시는것을 보고 조금 안타까웠다. 저런 질문과 답변을 들으면서 구글은 현재 우리가 상상하고 있는것 이상으로 기술적으로나 경험적으로 굉장한 발전을 하고 있을 것이라는 생각이 들기 때문이였지.

추측하면서 논문을 읽어볼 수 밖에 없는것이 상당히 안타까울 따름이다.

첫번째 질문에서 5년전 페이퍼라는 말이 얼마나 그들에게 우월감을 줄지는 안봐도 뻔한거 같다. 

또한 IT강국 대한민국의 말이 쪽팔리는 순간이였다.

우리도 저런 인프라가 어서 빨리 만들어지는 날이 오길 바랄 뿐이다.

CC BY-NC 4.0 구글 엔지니어에게 물어본것들 by from __future__ import dream is licensed under a Creative Commons Attribution-NonCommercial 4.0 International License.