데이터 마이닝에 대한 광범위한 개론서로 학생, 교수, 연구원 및 전문가들이 쉽게 이해할 수 있도록 만들었다. 데이터, 분류, 연관분석, 군집화, 이상치 탐지의 다섯 가지 주요 주제에 대해 다루었다. 기본 개념에 대해 상당한 분량의 예제와 그림, 연습문제를 제공하여 독자들의 이해를 도울 수 있도록 구성하였다. 또한 각 장의 뒤에는 고급 주제, 참고 문헌 설명 등을 실어 두어 관심 있는 독자들이 보충 학습을 할 수 있도록 했다.
용환승|역자
이화여자대학교 정보통신공학부 교수
나연묵|역자
단국대학교 전자컴퓨터공학부 교수
박종수|역자
성신여자대학교 컴퓨터정보학부 교수
승현우|역자
서울여자대학교 컴퓨터학부 교수
이민수|역자
이화여자대학교 정보통신공학부 교수
이상준|역자
숭실대학교 컴퓨터학부 교수
최린 |역자
고려대학교 전기전자전파공학부 교수
제1장 서론
1.1 데이터 마이닝이란 무엇인가?
1.2 계기가 된 도전들
1.3 데이터 마이닝의 기원
1.4 데이터 마이닝 작업
1.5 이 책의 범위와 구성
1.6 참고문헌 설명
1.7 연습문제
제2장 데이터
2.1 데이터의 타입
2.2 데이터 품질
2.3 데이터 전처리
2.4 유사도와 비유사도의 척도
2.5 참고문헌의 설명
2.6 연습문제
제3장 데이터 탐색
3.1 아이리스 데이터 집합
3.2 요약 통계
3.3 가시화
3.4 OLAP와 다차원 데이터 분석
3.5 참고문헌 설명
3.6 연습문제
제4장 분류:기본개념, 의사결정, 트리모델 평가
4.1 서론
4.2 분류 문제 해결을 위한 일반적인 접근 방법
4.3 의사결정 트리 귀납
4.4 모델 과잉적합
4.5 분류기 성능 평가
4.6 분류기 비교 방법
4.7 참고문헌 설명
4.8 연습문제
제5장 분류:다른 방법들
5.1 규칙기반 분류기
5.2 인접 이웃 분류기
5.3 베이지안 분류기
5.4 인공신경망(ANN)
5.5 지지도 벡터 기계(SVM)
5.6 앙상블 기법
5.7 클래스 불균형 문제
5.8 멀티클래스 문제
5.9 참고문헌 주석
5.10 연습문제
제6장 연관분석:기본 개념과 알고리즘
6.1 문제 정의
6.2 빈발 항목집합 생성
6.3 규칙 생성
6.4 빈발 항목집합들의 간결한 표현
6.5 빈발 항목집합들을 생성하기 위한 대체 방법
6.6 FP-성장 알고리즘
6.7 연관 패턴의 증가
6.8 편향 지지도 분포의 영향
6.9 참고문헌 설명
6.10 연습문제
제7장 연관 분석:고급 개념
7.1 범주형 속성 처리
7.2 연속형 속성 처리
7.3 개념 개층 처리
7.4 순차 패턴
7.5 부분 그래프 패턴
7.6 비빈발 패턴
7.7 참고문헌 설명
7.8 연습문제
제8장 군집분석: 기본 개념과 알고리즘
8.1 개요
8.2 K-means
8.3 병합형 계층 군집화
8.4 DBSCAN
8.5 군집 평가
8.6 참고문헌 설명
8.7 연습문제
제9장 군집분석: 부가적인 문제와 알고리즘
9.1 데이터, 군집, 그리고 군집화 알고리즘의 특성
9.2 프로토타입기반의 군집화
9.3 밀도기반 군집화
9.4 그래프기반 군집화
9.5 확장성 있는 군집화 알고리즘
9.6 어떤 군집화 알고리즘을 선택할 것인가?
9.7 참고문헌 설명
9.8 연습문제
제10장 이상치 탐지
10.1 기초 지식
10.2 통계 접근 지식
10.3 근접성 기반 이상치 탐지
10.4 밀도-기반 이상치 탐지
10.5 군집 기반 기법
10.6 참고문헌 설명
10.7 연습문제