典型文献
消除随机一致性的互信息及决策树算法
文献摘要:
在决策学习过程中,由于缺乏详细的知识而进行的逻辑欠缺的随机猜测可能会与实际情况形成随机一致性,其广泛存在于分类等学习任务中,对学习模型的泛化能力和决策结果造成影响.在分类过程中,信息熵作为特征评价的重要指标之一,在特征评价中会存在多值偏向(偏向于选择取值较多的特征)的问题.文章从消除决策过程中的随机一致性出发,选择使用一种消除随机一致性的互信息作为特征选择的指标,首先将消除一致性的互信息与信息增益、信息增益比等指标进行比较,说明了该指标可以有效消除随机一致性,解决多值偏向问题,从而更好地进行特征选择.然后基于该指标,提出消除随机一致性的决策树方法,并在9个真实数据集上验证其有效性.实验结果表明,消除随机一致性的互信息相较于传统的信息熵能够有效地解决信息增益的多值偏向问题,且消除随机一致性的决策树算法相较于传统的ID3算法、C4.5算法以及CART算法具有更高的平均分类准确率.
文献关键词:
随机一致性;信息熵;决策树
中图分类号:
作者姓名:
钱宇华;王川杭;王婕婷
作者机构:
山西大学大数据科学与产业研究院,山西太原030006;山西大学计算智能与中文信息处理教育部重点实验室,山西太原030006;山西大学计算机与信息技术学院,山西太原030006
文献出处:
引用格式:
[1]钱宇华;王川杭;王婕婷-.消除随机一致性的互信息及决策树算法)[J].山西大学学报(自然科学版),2022(05):1206-1215
A类:
B类:
随机一致性,互信息,决策树算法,决策学,学习过程,猜测,学习任务,泛化能力,造成影响,分类过程,信息熵,特征评价,择取,决策过程,特征选择,信息增益比,真实数据,ID3,C4,CART,平均分,分类准确率
AB值:
0.30346
相似文献
机标中图分类号,由域田数据科技根据网络公开资料自动分析生成,仅供学习研究参考。