이 책은 크게 5개 분야로 구성되어 있는데, Part 1은 데이터 분석에 대한 개요를 다루고, Part 2는 파이썬 핵심 문법에 대하여 학습한다. Part 3은 데이터 분석 관련 라이브러리에 대하여 다루고, Part 4는 데이터 전처리와 정형화에 대하여 학습하며, Part 5는 다양한 주제의 데이터 분석 미니 프로젝트를 통하여 데이터 탐색과 분석에 관한 내용을 학습한다.
파이썬을 처음 배우는 학습자를 위해 2장과 3장에서 파이썬 핵심 문법을 다루었으나 학습자의 수준에 따라 융통성 있게 내용의 폭과 깊이를 조절하여 진행하면 좋을 것이다.
오경선
2002년 상명대학교 교과교육학과 정보·컴퓨터교육 전공(교육학석사)
2016년 성균관대학교 일반대학원 교과교육학과 컴퓨터교육전공(교육학박사)
2017년~2019년 단국대학교 SW중심대학사업단 강의전담조교수
2019년~현재 건국대학교 상허교양대학 조교수
관심분야: SW교육, 컴퓨터교과교육, 컴퓨팅사고, 프로그래밍교육, 인공지능교육, etc.
장은실
2001년 동국대학교 교과교육학과 컴퓨터교육전공(교육학석사)
2007년 동국대학교 일반대학원 컴퓨터공학과(공학박사)
2008년~2011년 동국대학교 산업기술연구원 전임연구원
2016년~2018년 (주)명리 개발지원팀 이사
2018년~2020년 성균관대학교 소프트웨어대학 초빙교수
2020년~2021년 한양대학교 소프트웨어학부 SW교육전담교수
2021년~현재 중부대학교 학생성장교양학부 조교수
관심분야: SW교육, SW융합교육, 컴퓨팅기반문제해결, 데이터분석교육, 인공지능교육, 인공지능 윤리, etc.
양숙희
2002년 동국대학교 교과교육학과 컴퓨터교육전공(교육학석사)
2016년 동국대학교 경영대학원 경영정보(경영학박사)
2003년~현재 신구대 겸임교수, 대학교(건국대, 경기대, 단국대, 이화여대) 외래교수
2012년~현재 연소프트 기술지원 팀장
2018년~현재 성균관대학교 소프트웨어대학 겸임교수
관심분야: SW교육, SW융합교육, 컴퓨팅사고, 프로그래밍교육, 인공지능교육, etc.
Part 1. 데이터 분석이란?
Chapter 01 데이터 분석 개요
1.1 데이터 분석 이해
1.2 데이터 분석 활용 분야
1.3 데이터 분석 도구
1.4 데이터 분석 처리 과정
Part 2. 파이썬 기초
Chapter 02 데이터 분석을 위한 파이썬 핵심 문법 1
2.1 코랩 환경
2.2 변수
2.3 연산자
2.4 표준 입출력
2.5 선택문
2.6 반복문과 기타 제어문
2.7 함수
Chapter 03 데이터 분석을 위한 파이썬 핵심 문법 2
3.1 컬렉션 자료형
3.2 리스트 내표
3.3 정규 표현식
3.4 파일 입출력
Part 3. 데이터 분석 관련 라이브러리
Chapter 04 넘파이(Numpy) 라이브러리 기초
4.1 넘파이 배열의 개념 및 특징
4.2 넘파일 배열 생성
4.3 넘파이 배열 조회
4.4 배열의 연산
4.5 배열 변환
Chapter 05 판다스(Pandas) 라이브러리 기초]
5.1 판다스 개념 및 특징
5.2 판다스 객체 생성
5.3 판다스 데이터 확인하기
5.4 판다스 데이터 선택하기
5.5 판다스 결측 데이터 처리하기
5.6 판다스 데이터 가공하기
5.7 판다스 데이터 그룹핑하기
Chapter 06 판다스(Pandas) 라이브러리 활용
6.1 붓꽃 데이터 분석하기
6.2 타이타닉 데이터 분석하기
Chapter 07 시각화 라이브러리
7.1 데이터 시각화 이해
7.2 맷플롯립(Matplotlib) 라이브러리
7.3 시본(Seaborn) 라이브러리
Part 4. 데이터 전처리와 정형화
Chapter 08 데이터 전처리
8.1 데이터 전처리의 이해
8.2 데이터 전처리 실습 1
8.2 데이터 전처리 실습 2
Chapter 09 시계열 데이터 전처리
9.1 시계열 데이터의 이해
9.2 시계열 데이터 전처리 실습
9.3 시계열 데이터 분석
Chapter 10 자연어 전처리
10.1 자연어
10.2 워드클라우드
10.3 자연어 처리 실습
Part 5. 다양한 주제의 데이터 분석 미니 프로젝트
Chapter 11 환경 관련 데이터 분석
11.1 분석 대상 데이터 수집
11.2 데이터 확인하기
11.3 데이터 병합하기
11.4 데이터 분석 및 시각화
Chapter 12 건강 관련 데이터 분석
12.1 분석 대상 데이터 수집
12.2 데이터 가공
12.3 데이터 분석 및 시각화
Chapter 13 쇼핑몰 데이터 분석
13.1 문제 정의와 데이터 탐색
13.2 데이터 전처리
13.3 데이터 특성 분석
13.4 데이터 특성 정리와 제안
우리가 살고 있는 세상은 대부분 소프트웨어로 이루어져 있다. 또한 하루가 다르게 발전하고 있는 하드웨어와 정보통신기술로 수많은 데이터들이 만들어지고 있다. 이렇게 생성된 많은 양의 데이터들은 약간의 노력과 기술을 이용하면 다양한 분야에서 의미있는 정보로 재생산될 수 있다.데이터를 분석하면 의미있고 유용한 정보를 만들 수 있는데, 이를 위해 데이터를 적당히 정제하고 분석하는 과정을 거쳐 보기 좋은 형태로 시각화해야 한다.
이 책은 이러한 과정을 도와줄 수 있도록 구성하였다. 파이썬에 대한 핵심 문법을 다루고, 데이터 분석 관련 라이브러리, 데이터 전처리 및 정형화, 다양한 주제의 미니 프로젝트로 구성하여 실질적인 데이터 분석을 체득할 수 있도록 하였다. 배운 내용을 단순히 익히고 데 그치는 것이 아니라 다양한 형태의 데이터를 분석하는 실전문제까지 포함하고 있어 실습을 통해 실력을 향상시킬 수 있을 것이다.