isbn: 9791160100006
빅데이터가 제목에 포함되어 있지만, 한국 근현대사를 통계로 분석했다. 빅데이터는 이런 분석에 딱히 사용하지 않은 기분이다. 마지막에는 통계를 기본으로 한 6sigma, PCDA 활동을 간략하게 설명했다. 여러 통계를 기반으로 한 활동이 많은데, 이 책이 간단하게 정리를 잘 했다.
빅 데이터를 제대로 활용하려면 여러 통계를 기본으로 한 프로세스를 얼마나 빠르고 정확하게 피드백 받을 수 있는지가 중요하다. 관심있는 데이터를 수집하기 어렵고(처음 이니까), 수집한 데이터를 어느 기준으로 바라보냐에 따라 다양한 생각을 할 수 있다. 여러 생각 중 분석 주체가 가진 도메인 지식으로 가치를 산출해야 한다. 맞는 가설을 세운다면 통계적 분석으로 (가설이) 맞는지 틀린지 결론을 내는 전략이 핵심이다.
각 기업, 한국 의료보험, 인구 구조변화 등 다양한 사례를 통계를 근거로 설득력있게 설명한다. 책에 기록된 모든 예측이 모두 맞다고 볼 수 없지만 데이터에 근거한 합리적인 예측이다. 2050년에 세계 인구가 꾸준히 증가한다 예측했지만, 코비드19를 경험하면서 이 예측이 틀릴 확률이 높아졌다. 이런 상황에서 회귀분석이 의미없다. 데이터를 잘 활용하는 사람이 너무 당연하게 모두가 기본으로 생각한는 예측에서 만족하지 않고 남들이 예측하지 못한 부분에서 기회(아마도 위기일 듯 하다)를 찾아 advantage를 얻을 수 있다. 내 질문에 대한 답을 데이터로 정확하게 얻는 사람이 통계, 데이터 수집, 분석, 해당 분야에 대한 깊이있는 지식으로 이를 수행할 수 있다.