Skip to main content
数据科学学习笔记
Show table of contents
Table of contents
前言
1
R Markdown
微生物生态学
2
Vegan 使用技巧
3
概率论和数理统计
数据挖掘实战
4
关于《数据挖掘实战》
5
关联规则挖掘
6
聚类分析
7
线性模型和广义线性模型
8
神经网络
9
决策树
Others
10
处理 Office 文件
11
ggtree 代码解析
参考文献
第 9 章
决策树
决策树根据自变量的值进行递归划分以预测因变量。
如果因变量是分类变量,则称为
分类树
;如果因变量是连续变量,则称为
回归树
。
决策树有以下优点:
可以直接处理定类自变量;
无需考虑对定序或连续自变量的转换;
对自变量的误差和异常值比较稳健,因为决策树只使用连续自变量取值的大小顺序;
能够有效的处理缺失值;
决策树的规则很容易解释;
同时也有如下缺点:
很难发现基于多个变量组合的规则;
能达到局部最优,但是无法达到全局最优;
树的结构很不稳定。
8
神经网络
10
处理 Office 文件
On this page
9
决策树