<핵심코어 데이터 분석 with 파이썬>은 최근 데이터 분석의 중요성이 강조되는 경향에 맞추어 파이썬을 활용한 데이터 분석을 설명하고, 학문적 전공과 상관없이 누구나 쉽게 파이썬 라이브러리를 사용하여 데이터 분석을 쉽게 익힐 수 있도록 구성하였다.
본서의 1~5장은 파이썬의 기본적인 사용법과 파이썬 함수들을, 6~9장은 아나콘다 플랫폼을 설치하여 주피터 노트북 환경에서 실습할 수 있는 환경을 제공하며 NumPy, Pandas, Matplotlib, Seaborn 파이썬 분석 라이브러리 및 시각화를 설명한다. 10~13장은 전처리, 웹 크롤링, 웹 스크래핑, 공공 데이터를 활용한 데이터 분석이 가능하도록 구성하였다.
각 장마다 예제, 진단문제, 요점정리, 연습문제, 수행평가를 삽입하여 배운 내용을 정리하고 문제 해결 능력을 기를 수 있도록 구성하였다. 그리고 기존 데이터 분석에서 많이 사용되던 통계학적 요소와 관련된 이론적 설명은 가급적 줄인 대신 가장 필수 요소인 분석 기법으로 누구나 데이터 분석을 활용해볼 수 있도록 구성하였다.
숭실대학교 컴퓨터공학과에서 공학석사, 컴퓨터학과에서 공학박사 학위를 취득했다. ‘달리배움’ 컴퓨터 학원을 17년 동안 운영하며 학생들을 지도했으며, 2007년부터 숭실대학교, 경원대학교, 삼육대학교, 경민대학에서 강의하고 있다. 저서로는 『새내기를 위한 컴퓨터 활용』(생능, 2009), 『IT CookBook 초보자 시리즈』(한빛미디어, 2009), 『ITQ 인터넷 기본서』(영진닷컴, 2010), 『우리 친구해요! facebook』(크라운출판사, 2011) 등이 있다.
CHAPTER 01 데이터 분석 개념
1.1 데이터 분석 개념
1.1.1 빅데이터의 정의
1.1.2 빅데이터의 역사와 출현 배경
1.1.3 빅데이터의 특징
1.1.4 빅데이터의 장단점
1.1.5 빅데이터의 분석 처리 과정
1.1.6 빅데이터의 활용
요점정리
연습문제
수행평가
CHAPTER 02 파이썬 기본 문법
2.1 변수(variable)
2.1.1 변수란?
2.1.2 변수 생성 규칙
2.2 파이썬 자료형
2.2.1 기본 자료형
2.2.2 문자열 자료형
2.2.3 부울 자료형
2.3 파이썬 기본 연산자
2.3.1 산술 연산자
2.3.2 대입(할당) 연산자
2.3.3 복합 대입 연산자
2.3.4 관계(비교) 연산자
2.3.5 논리 연산자
2.3.6 문자열 연산자 : +, *, []
2.3.7 비트 연산자
2.3.8 쉬프트 연산자
2.4 문자열 포맷팅
2.4.1 % 형식 지정자
2.4.2 format() 함수
2.4.3 f-string 포맷팅
요점정리
연습문제
수행평가
CHAPTER 03 파이썬 기본 문법 2
3.1 print() 함수
3.1.1 print() 함수
3.2 input() 함수
3.3 if 조건문
3.3.1 조건문
3.3.2 if ~ else 문
3.3.3 중첩 if 문
3.3.4 if~elif~else 문
3.4 반복문
3.4.1 for 반복문
3.4.2 while 반복문
3.4.3 중첩 반복문
3.5 기타 제어문
3.5.1 break 문
3.5.2 continue 문
3.6 함수(function)
3.6.1 사용자 정의 함수
요점정리
연습문제
수행평가
CHAPTER 04 파이썬 기본 문법3
4.1 리스트(list)
4.1.1 리스트(list) 살펴보기
4.1.2 리스트 슬라이싱(slicing)
4.1.3 리스트(list) 활용하기
4.1.4 리스트(list) 삭제하기
4.1.5 리스트 항목 정렬하기
4.2 튜플(tuple)
4.2.1 튜플
4.2.2 튜플 활용하기
4.2.3 다중 리스트
4.3 딕셔너리(dictionary)
4.3.1 딕셔너리 구조
4.4 세트(set)
4.4.1 세트 구조
요점정리
연습문제
수행평가
CHAPTER 05 파이썬 기본 문법 4
5.1 예외 처리
5.1.1 예외 처리(try~except)
5.1.2 try ~ except ~ else ~ finally
5.2 파일 처리
5.2.1 파일 읽기
5.2.2 파일 쓰기
요점정리
연습문제
수행평가
CHAPTER 06 정규 표현식과 아나콘다 플랫폼
6.1 정규 표현식(Regular Expression)
6.1.1 정규 표현식
6.1.2 패턴 문자열
6.2 아나콘다(Anaconda) 플랫폼
6.2.1 아나콘다 플랫폼
6.2.2 주피터 노트북
요점정리
연습문제
CHAPTER 07 넘파이 라이브러리
7.1 넘파이(NumPy) 라이브러리
7.1.1 넘파이 설치 및 호출
7.1.2 넘파이 배열 생성하기
7.1.3 넘파이 배열 속성(type/shape/ndim/size)
7.1.4 넘파이 배열 플레이스홀더(placeholder)
7.1.5 넘파이 배열 arange()
7.1.6 넘파이 배열 추가 / 삽입 / 삭제 / 중복 제거
7.1.7 넘파이 배열 분리
7.1.8 넘파이 인덱싱 / 슬라이싱
7.1.9 넘파이 배열 연산
7.1.10 넘파이 수학함수
7.1.11 넘파이 배열 정렬
요점정리
연습문제
수행평가
CHAPTER 08 판다스(pandas) 라이브러리
8.1 판다스(pandas) 라이브러리
8.1.1 판다스
8.1.2 판다스 시리즈
8.1.3 시리즈 활용하기
8.1.4 데이터프레임(DataFrame)
8.1.5 외부 데이터 가져오기
8.1.6 그룹화하기
요점정리
연습문제
수행평가
CHAPTER 09 데이터 시각화
9.1 데이터 시각화
9.1.1 Matplotlib 라이브러리
9.1.2 시본(seaborn) 라이브러리
요점정리
연습문제
수행평가
CHAPTER 10 데이터 전처리
10.1 데이터 전처리
10.1.1 빅데이터 분석 프로세스
10.1.2 결측치(Missing Value)
10.1.3 결측치 탐색
10.1.4 이상치(outlier)
10.1.5 데이터 중복값
10.1.6 데이터 분할
요점정리
연습문제
수행평가
CHAPTER 11 스크래핑과 어휘 분석
11.1 웹 크롤링(Web crawling) 과 스크래핑(Scraping)
11.1.1 웹 크롤링
11.1.2 웹 스크래핑
11.1.3 CSV 파일
11.2 워드 클라우드(word cloud)와 KoNLPy 패키지
11.2.1 워드 클라우드
11.2.2 Count() 라이브러리
11.2.3 KoNLPy 라이브러리
요점정리
연습문제
수행평가
CHAPTER 12 데이터 분석 처리 1
12.1 데이터 분석 처리 1
12.1.1 자료 수집
12.1.2 데이터 가져오기
12.1.3 데이터 전처리 작업
12.1.4 데이터 추출
12.1.5 구간별 나누기
12.1.6 데이터 시각화 작업
요점정리
연습문제
수행평가
C
HAPTER 13 데이터 분석 처리 2
13.1 데이터 분석 처리 2
13.1.1 자료 수집
13.1.2 데이터 전처리 작업
13.1.3 데이터 그룹화하기
13.1.4 피벗 테이블 데이터 집계
13.1.5 데이터 시각화
요점정리
연습문제
수행평가
4차 산업혁명 시대에는 국가 또는 기업에서 얼마나 많은 데이터를 보유하고 그 데이터를 어떻게 잘 분석하는지에 따라 국가 경쟁력 및 기업의 수익 구조가 달라질 만큼 빅데이터가 매우 중요한 기술적 가치를 지닌다. 이러한 빅데이터를 통해서 다양하고 많은 데이터를 처리하여 분석하고 이를 유용한 정보로 추출해 그 가치를 극대화한 것이 오늘날 빅데이터가 자리매김하게 된 가장 큰 이유이다.
<핵심코어 데이터 분석 with 파이썬>은 데이터를 파이썬으로 분석하는 방법을 설명하고 있다. 파이썬의 기본적인 사용법과 파이썬 함수, NumPy, Pandas, Matplotlib, Seaborn 파이썬 분석 라이브러리 및 시각화, 전처리, 웹 크롤링, 웹 스크래핑, 공공 데이터를 활용한 데이터 분석으로 구성하였다. 챕터마다 있는 예제, 진단문제, 요점정리, 연습문제, 수행평가는 배운 내용을 정리하고 문제 해결 능력을 기를 수 있도록 삽입하였다. 또한 가장 필수 요소인 분석 기법으로 누구나 데이터 분석을 활용해볼 수 있도록 구성하였다.
본서 <핵심코어 데이터 분석 with 파이썬>을 통해 데이터 분석에 대한 자신감을 기르고 데이터 분석을 다양한 분야에 활용하여 전문가로 거듭날 것으로 기대된다.