isbn: 9791162240984 R을 사용하여 여러 통계 개념을 설명한다. 이런 개념은 R을 이렇게 사용하면 된다 이런 느낌이다. 어차피 통계 일도 모르는 난 R보다 python을 쓸 생각이다. 여기 개념을 현실에 어떻게 적용할 지 도저히 모르겠다. box plot에서 outlier가 많다면 이를 근거로 어떤 판단을 할까? 당연한 사실을 알기만 하고 그 다음은 보이지 않는다.
[카테고리:] 삶 자국
처음 배우는 데이터 과학
isbn: 9791162249727 프로그램, 전처리, 시각화, 확률, 특징값, 머신러닝 등 이 업계에서 일하는 사장이 갖춰야 할 기본? 소양을 설명한다. 한 사람이 이런 넓은 영역을 깊게 알지 못한다. 어느 영역에 어떤 기술을 적용할 지 잘 판단함이 정말 뛰어난 능력이다. 술술 읽히지만 이 책을 보고 데이터 분석, 과학을 실 업무에 적용하긴 어렵다. 기초를 설명한 책, 동영상을 찾아 추가로…… 처음 배우는 데이터 과학 계속 읽기
데이터 과학자가 되는 핵심 기술
isbn: 9791161750767 초보가 보기 괜찮은 책이다. 처음부터 고급까지 정확하고 세세하게 설명했다. 물론 쉽다. 하긴 python 코드 자체가 워낙 쉬우니?? Frequentist, Bayesian에서 t-검증, 카이 제곱 검증까지 하면 대략 현장에서 응용할 수 있어 보인다. 중간에 검증할 수 있는 단계도 필요하다. 책 보면 모두 이해됐다고 하지만 막상 하려면 틀린 부분이 있을 테니. 나중에 시간되면 다시 한번 읽어볼 책이다.
데이터 분석을 떠받치는 수학
isbn: 9791158391041 빅 데이터를 현장에 적용하려면 통계를 알아야 된다는 생각으로 여러 책을 골라 봤다. 이 책은 엑셀로도 데이터 분석을 할 수 있음을 보여준다. 당연한거 아닌가? 지금 엑셀보다 좋은 도구들이 많다. 그래도 가끔 필요할 때도 있다. 회사에서 보안을 이유로 다른 프로그램을 막았을 경우. mean, median, covariance 등 여러 수식을 설명하고 이를 엑셀로 구해본다. 굳이 구해보지 않아도…… 데이터 분석을 떠받치는 수학 계속 읽기
파이썬으로 풀어보는 회귀분석
isbn: 9791161752501 통계를 이해하고 이를 python으로 풀어본 책이다. 기초 개념을 모르면 책을 이해할 수 없다. 나에겐 코드 따라해 보기가 전부였다. 좌절. keras+tensorflow 나오기 전에 참 힘들게 적용 했겠다.