R을 활용한 데이터분석의 기초부터 실전까지
이 책은 데이터분석과 R 프로그래밍을 배우고자 하는 초보 입문자들이 쉽게 따라해 보며 학습할 수 있도록 구성하였다. 각각의 챕터 내에서 많은 예제를 포함하고 있으며, 각 절마다 배운 내용을 복습해볼 수 있도록 실습문제를 배치하여 스스로 사고하고 해결해 볼 수 있는 기회를 제공하고 있다.
1~3장은 R과 R 스튜디오의 설치 및 기본적인 사용법과 R의 기초 함수들을 설명하였고, 4~6장에서는 데이터의 형태를 파악하는 과정과 데이터를 전처리하고 정제하는 방법을 다루었다. 7장은 데이터를 시각화 하는 방법을 설명하였으며 8~11장은 데이터분석에 대한 다양한 실전 예제들을 통해 데이터를 시각화하고 분석해볼 수 있도록 구성하였다.
연용호 교수 목원대학교 스톡스대학 SW교양학부
고유정 교수 목원대학교 스톡스대학 SW교양학부
구진희 교수 목원대학교 스톡스대학 SW교양학부
조도은 교수 목원대학교 스톡스대학 SW교양학부
최정희 교수 목원대학교 스톡스대학 SW교양학부
Chapter 01 R의 소개와 환경구축
1.1 R이란
1.2 R 설치와 실행
1.3 R 스튜디오 설치와 환경 설정
1.4 R 스크립트 작성과 실행
Chapter 02 데이터의 구조
2.1 데이터의 종류와 변수
2.2 파일 입출력
Chapter 03 기초함수와 패키지
3.1 함수의 정의 및 기초함수
3.2 제어문
3.3 패키지 소개
Chapter 04 데이터분석
4.1 데이터 형태
4.2 변수명 변경
4.3 파생 변수 생성
Chapter 05 데이터 전처리
5.1 데이터 추출하기
5.2 데이터 정렬하기
5.3 데이터 변형하기
5.4 데이터 요약하기
5.5 데이터 결합하기
Chapter 06 데이터 정제
6.1 결측 데이터 처리
6.2 이상 데이터 처리
Chapter 07 그래프
7.1 파이차트
7.2 막대그래프
7.3 히스토그램
7.4 선그래프
7.5 산점도
7.6 상자그림
Chapter 08 실전 데이터 분석
8.1 타이타닉호의 생존율
8.2 다이아몬드의 품질
8.3 2019년도 관광객이 가장 많이 방문한 제주도 관광지
8.4 제주도를 가장 많이 찾아오는 시기
8.5 코로나19에 따른 관광지의 영향
Chapter 09 지도시각화
9.1 지도정보를 포함하는 패키지
9.2 단계구분도 그리기
Chapter 10 텍스트 마이닝
10.1 텍스트 마이닝과 워드 클라우드
10.2 대통령 연설문 키워드 분석
Chapter 11 공공 데이터의 활용
11.1 오픈 API 활용
11.2 네이버 오픈 API
무궁무진한 데이터의 영역, 이 모든 데이터를 전부 분석하고 활용할 수 있을까?
세상 속 다양한 분야의 수많은 데이터들은 기하급수적으로 증가하고 있고 그 속도는 더욱 빨라지고 있다. 이러한 방대한 데이터들을 분석하고 그 속에서 유의미한 정보들을 추출한 후 이를 의사결정에 활용할 수 있도록 하는 기술이 요구되고 있는 추세이다.
R은 통계 분석과 그래픽을 위한 언어이자 환경으로, 데이터 정제 및 가공으로부터 통계 분석, 데이터 시각화, 텍스트 마이닝 등과 같은 고급 분석에까지 이용할 수 있다. 또한 전세계 누구나 무료로 사용 가능한 오픈소스이기 때문에 대부분 명령어가 라이브러리화 되어 있어 초보자들도 쉽게 배울 수 있다는 장점이 있다.
이 책은 R을 이용한 데이터분석의 기초부터 고급 응용까지 배울 수 있도록 구성되어 있다. 다양한 예제 프로그램과 실습문제를 통해 직접 데이터분석의 과정을 실습해 보며 응용 능력을 향상시킬 수 있을 것이다.