데이터 과학이란? – 미래는 데이터를 제품화하는 회사와 개인에게 달려있다.
전부터 번역하고 싶었던 글인데, 누군가 번역을 잘 해줘서 링크 걸었다.
특히 아래 대목은 페이스북의 데이터 과학자들이 어떤 방식으로 일하는지 아주 간단하고 명료하게 보여준 글이 아닐까 한다.
…언제든, 팀원은 파이썬으로 다단계 처리 파이프라인을 작성하고, 가설 시험을 설계하며, R을 가지고 데이터 샘플의 회귀분석을 수행하고 데이터 위주의 제품이나 하둡 서비스를 가지고 알고리즘을 구현해내며 우리의 분석 결과를 가지고 다른 팀원과 소통할 수 있었다.
사실 R에서 샘플링을 전혀 하지 않고 분석이나 플로팅을 한다는 것은 정말 인내심을 요하는 작업인거 같다. 이미 페이스북 엔지니어들은 그런 방식으로 R을 사용한거 같고, 나 또한 경험상 Python과 같은 스크립트 언어를 사용하는지도 모르겠다.
페이스북 Data Scientist들이 어떻게 일하는가? by from __future__ import dream is licensed under a Creative Commons Attribution-NonCommercial 4.0 International License.