2013. 6. 25. 16:41

[Head First Data Analysis] 데이터 분석 참 쉽죠?

헤드 퍼스트 데이터 분석 Head First Data Analysis헤드 퍼스트 데이터 분석 Head First Data Analysis - 10점
마이클 밀튼 지음, 김경태 옮김/한빛미디어(한빛아카데미)

개인적으로 헤드 퍼스트 시리즈를 무척 좋아하는데, 헤드 퍼스트 데이터 분석도 읽어보니 참 좋은 책이네요.
데이터 분석은 어떻게 시작해야 하는 걸까 막막하신 분들 많으시죠?
서비스를 개선하고 싶은 기획자, UI 를 개선하고 싶은 디자이너, data scientist 등 데이터를 분석하고자 하는데 어떻게 시작할 지 모르는 분들은 읽어보시면 좋은 책입니다.

헤드 퍼스트 시리즈 답게 다양한 예제로 구성되어 있어서 대체로 쉽게 읽을 수 있습니다.
책 의 중간에 질문으로만 구성된 페이지가 있는데 답을 미리 생각해 보시고 다음 페이지에 있는 예시 답안을 참고하시면 많은 도움이 됩니다. 
번역도 훌륭합니다. 

첫 번째 챕터는 데이터를 분석하는 단계에 대한 내용입니다.
문제 정의 -> 데이터 분해 -> 평가 -> 결정 을 반복하여 데이터 분석이 이루어 집니다. 

두 번째 챕터는 이론을 세우고 비교를 통해 평가하는 단계에 대해 더 자세히 설명하고 있습니다. 

세 번째 챕터는 가설의 조건에 부합하는 영역에서 최적의 해를 찾는 방법을 알려줍니다. 

엑셀에서 제공하는 기능을 사용하여 최적의 해를 찾는 방법에 대해 설명하고 있어서 유용합니다. 

 네 번재 챕터는 데이터 시각화에 대한 챕터인데, ˝데이터 시각화란 적절한 비교를 말합니다˝ 라고 말하는 페이지가 인상 깊네요.
이와 관련하여 부록에 에드워드 터프티의 분석적인 디자인에 대한 기본 원칙이 나와 있습니다.  
˝비교, 대조, 차이를 보여준다.˝
˝인과관계, 구조, 설명, 체계적인 구조를 나타낸다.˝
˝다변량 데이터를 나타낸다. 즉, 여러 변수를 보여준다.˝
˝단어, 숫자, 이미지, 그래프를 완벽하게 통합한다.˝
˝증거에 대해 철저하게 설명한다.˝
˝결국, 해석에 대한 프레젠테이션의 성공 여부는 내용의 질, 유효성, 완전성에 달려 있다.˝
 이 글은 에드워드 터프티의 저서 ˝Beautiful Evidence˝ 에서 발췌했다고 합니다. 

다섯 번째 챕터는 추론을 통한 가설 검정에 대한 내용입니다. 

여섯 번째 챕터에서 처음으로 통계 기법중 하나인 조건부 확률에 대한 이론인 베이지안 통계를 소개하고 있습니다. 

일곱 번째 챕터는 모호한 말 보다 주관적인 확률을 수치로 표현하는 것에 대한 장점에 대해 얘기하고 있고, 

여덟 번째 챕터는 주어진 자원이 부족할 때 사용하는 휴리스틱에 대해 설명하고 있습니다. 

아홉 번째 챕터는 시각화의 하나인 히스토그램에 대한 설명과 히스토그램을 R 에서 그리는 방법으로 구성되어 있습니다. 

열 번째 챕터는 회귀 분석을 통한 예측, 

열한 번째 챕터는 분석 또는 예측 모델의 오류를 다루는 방법에 대해 설명하고 있습니다. 

열 두번째 챕터는 관계형 데이터 베이스, 

열 세번째 챕터는 엑셀이나 R 을 사용하여 필요한 데이터를 추출하는 방법에 대해 설명하고 있습니다.

http://mindasom.tistory.com2013-06-25T07:41:280.31010