isbn: 9788963220598
빅데이터를 가지고 있으면 모든 문제를 해결할 수 있어 보였다. 빅 데이터를 가지고 있음으로는 아무것도 할 수 없다. 데이터에서 인사이트를 얻기 위한 적절한 도구와 강인한 의지가 있어야 한다. 도구는 통계, 확률을 근거로한 여러 분석 방법이다. 의지란 데이터를 보고 현실을 인정하고 개선하려는 노력이다.
우리가 관측하는 모든 현실은 확률에 근거한다. 확률이 높으면 자주 보이고, 낮으면 드물게 보인다. 이를 근거로 가설을 세우고, 그 가설이 틀림을 증명하는 방법을 이미 여러 분야에서 사용한다.
빅 데이터로 무엇을 하려면 기초 통계 분석을 알아야 하는데, 이 책은 이를 도와준다. 개념을 모르고 빅 데이터를 조작함은 삽질이다. 지금 빅 데이터가 뜨는 이유가 기존 이론을 검증할 수 있을 컴퓨팅 파워를 얻었기 때문이다.