본문 바로가기

etc./개발자 리뷰

[개발자 리뷰] 모두의 데이터분석 with 파이썬

개발자 리뷰어로서 처음으로 리뷰해드릴 책은 '모두의 데이터분석 with 파이썬' 이라는 책입니다.

모두의 데이터 분석 with 파이썬

 

처음 책을 받았을 때, 두께가 조금 있어서 내용도 어려운 책이 아닐까 하는 걱정이 있었는데요

 

막상 책을 읽어보니 책에 나온 코드를 따라 실습하기 위해 필요한 툴들에 대한 설명과 설치 과정을 쉽게 설명을 잘 해주었고

 

데이터 분석에 쓰이는 파일 추출 과정 및 파이썬 라이브러리를 통한 분석과정이 따라하기 쉽게 되어있었습니다.

 

특히나 각 문제의 마지막 부분에 한번 더 코드를 전체적으로 정리하며 설명해주는 부분이 인상적이었습니다.

 

1장 기온 공공데이터

우선 1장에 해당하는 '기온 공공데이터' 에서는 기온 공공데이터를 제공하는 웹 사이트에서 CSV형식으로 데이터를 가져오는 방법과 이를 토대로 분석하기 위하여 사용될 툴(아나콘다를 통한 주피터 노트북 활용)에 대한 설치 방법에 대해 설명해 줍니다.

 

단순히 툴들의 설치 방법 뿐만 아니라 왜 해당 툴들을 사용하는 것이 편리하며 유용한 것이지 그 이유까지 쉽게 설명해 주고 있습니다.

 

뿐만 아니라 1장의 제목처럼 실제 기온 공공데이터를 CSV파일로 내려받은 후, 이를 주피터 노트북 상에서 가져와 분석하는 과정을 담고 있습니다. (ex. 서울의 기온이 가장 높았을 때와 가장 낮았을 때는 언제인가)

 

2장 데이터 시각화 기초

 

2장에서는 데이터 시각화에 필요한 기본적인 라이브러리인 'matplotlib'에 대해 설명합니다.

 

matplotlib의 가장 기초적인 활용부터 시작해서 CSV파일을 토대로한 다양한 시각화까지 재미있는 내용들과 함께 다루고 있습니다.

 

3,4장에서는 앞서 배운 내용들을 토대로 인구 데이터, 대중교통 데이터들을 다양하게 분석하게 됩니다.

 

이 단원들 역시 앞서 배웠던 단원들과 난이도 면에서는 큰 차이가 없고 다양한 데이터들을 분석한다는 의미를 가지는 것 같습니다.

 

5장 파이썬 데이터 분석 라이브러리를 활용한 프로젝트

 

5장은 다소 어려울 수 있는 단원입니다. 앞선 단원들에서는 단순히 CSV파일들을 가져와 데이터분석에 사용하였다면, 이 단원에서는 CSV파일들을 가져와 수와 행렬을 다룰 때 쓰이는 numpy 라이브러리와 pandas 라이브러리를 사용하여 좀 더 고차원적인 분석을 진행하게 됩니다.

 

하지만 설명이 쉽게 잘 되어있는 만큼 차근차근 따라한다면 초보라 하더라도 모두 소화할 수 있을 정도의 내용이라고 보여집니다.

 

다만, 마지막 단원에서까지 CSV파일들을 대상으로만 분석을 진행하여 다양한 포맷의 데이터파일들에 대한 데이터 추출과 분석이 이루어지지 못하고 있다는 측면에서는 아쉬움이 있습니다.

 

파이썬 초보들을 위한 부록

 

가장 인상적이었던 것은 바로 부록이었는데요, 파이썬 초보들을 위해 기초가 되는 파이썬 문법들을 간결하게 하나하나 정리해 두었습니다.

 

비단 초보 뿐만 아니라 파이썬을 오랜만에 사용하여 문법을 까먹고 있었던 분들에게도 유용할 것 같습니다.

 

이제 막 파이썬을 한 두번 접해본 혹은 처음 파이썬을 접하게 된 사람들에게 딱 맞는 파이썬을 이용한 데이터 분석 책이라는 것을 느낄 수 있었고 강추합니다!