第 4 章 关于《数据挖掘实战》
该部分内容是学习《数据挖掘——基于 R 语言的实战》一书时做的读书笔记。
作者简介
张俊妮,美国哈佛大学统计学博士,现任北京大学国家发展研究院副教授。主要研究领域:人口统计学、数据挖掘与文本挖掘、因果推断。有十余年给北京大学各学科的学生讲授数据挖掘课程的经验,曾获北京大学教学优秀奖。
关于本书的内容
本书以深入浅出的语言系统地介绍了数据挖掘的框架和基本方法,主要内容包括:数据挖掘与 R 语言概述、数据理解、数据准备、关联规则挖掘、聚类分析、线性模型与广义线性模型、神经网络的基本方法、决策树、基于决策树的模型组合、模型评估与比较、R 语言数据挖掘大案例。本书使用基于 R 语言的数据挖掘案例贯穿全书,并辅以上机实验和习题,帮助读者熟练使用 R 语言进行数据挖掘。