加入收藏 | 设为首页 | 会员中心 | 我要投稿 玉林站长网 (https://www.0775zz.com/)- 科技、建站、经验、云计算、5G、大数据,站长网!
当前位置: 首页 > 大数据 > 正文

一文知道决策树的利弊

发布时间:2021-08-23 21:17:52 所属栏目:大数据 来源:互联网
导读:决策树的优点 1、决策树易于理解和解释,可以可视化分析,容易提取出规则; 2、可以同时处理标称型和数值型数据; 3、比较适合处理有缺失属性的样本; 4、能够处理不相关的特征; 5、 测试 数据集时,运行速度比较快; 6、在相对短的时间内能够对大型数据源

决策树的优点

  1、决策树易于理解和解释,可以可视化分析,容易提取出规则;

 

  2、可以同时处理标称型和数值型数据;

  3、比较适合处理有缺失属性的样本;

  4、能够处理不相关的特征;

  5、测试数据集时,运行速度比较快;

  6、在相对短的时间内能够对大型数据源做出可行且效果良好的结果。

  决策树的缺点

  1、容易发生过拟合(随机森林可以很大程度上减少过拟合);

  2、容易忽略数据集中属性的相互关联;

  3、对于那些各类别样本数量不一致的数据,在决策树中,进行属性划分时,不同的判定准则会带来不同的属性选择倾向;信息增益准则对可取数目较多的属性有所偏好(典型代表ID3算法),而增益率准则(CART)则对可取数目较少的属性有所偏好,但CART进行属性划分时候不再简单地直接利用增益率尽心划分,而是采用一种启发式规则)(只要是使用了信息增益,都有这个缺点,如RF)。

  4、ID3算法计算信息增益时结果偏向数值比较多的特征。

(编辑:玉林站长网)

【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容!

    热点阅读