isbn: 9791158391041
빅 데이터를 현장에 적용하려면 통계를 알아야 된다는 생각으로 여러 책을 골라 봤다. 이 책은 엑셀로도 데이터 분석을 할 수 있음을 보여준다. 당연한거 아닌가? 지금 엑셀보다 좋은 도구들이 많다. 그래도 가끔 필요할 때도 있다. 회사에서 보안을 이유로 다른 프로그램을 막았을 경우.
mean, median, covariance 등 여러 수식을 설명하고 이를 엑셀로 구해본다. 굳이 구해보지 않아도 되는데 책 작성 목적에 맞게 찾았다. Principal component analysis로 야구 선수를 분석했다. 분석해도 그 분석 결과를 명확하게 설명할 수 없다. 물론 현장에서 어떻게 사용하는지에 따라 다르겠다. 빅데이터에서 insight를 얻으려면 피곤하다. 빅데이터에서 얻은 insight가 우리 상식을 넘는 새로움을 가지고 있을까? 그런 경우는 얼마나 될까?
데이터 분석은 입력/출력에 따라 품질 변화가 많다. 어떤 질문을 하고 어떻게 검증하냐가 많은 차이를 만든다.
여러 기법 등을 적용하여 분석한 불량품 감지도 현장 적용하기 어렵다. 3sigma를 넘어가면 문제라고 보았을 때, 불량을 감지하기 위해서 전수 검사를 해야 한다. 어느 세월에 전수 검사를 하고 있는지…3sigma에 해당하는 제품을 포기하고 손실로 잡는게 맞다. 손실을 줄이기 위해 sigma 수준을 높여야 된다가 결론일 듯 하다.