基于改进SMOTE的非平衡数据集分类研究
王超学; 潘正茂; 董丽丽; 马春森; 张星
刊名计算机工程与应用
2012-01-16
期号02页码:184-187+245
关键词非平衡数据集 分类 支持度 轮盘赌选择 合成少数过采样技术(SMOTE)
英文摘要针对SMOTE(SyntheticMinorityOver-samplingTechnique)在合成少数类新样本时存在的不足,提出了一种改进的SMOTE算法(SSMOTE)。该算法的关键是将支持度概念和轮盘赌选择技术引入到SMOTE中,并充分利用了异类近邻的分布信息,实现了对少数类样本合成质量和数量的精细控制。将SSMOTE与KNN(K-NearestNeighbor)算法结合来处理不平衡数据集的分类问题。通过在UCI数据集上与其他重要文献中的相关算法进行的大量对比实验表明,SSMOTE在新样本的整体合成效果上表现出色,有效提高了KNN在非平衡数据集上的分类性能。
URL标识查看原文
语种中文
内容类型期刊论文
源URL[http://ir.nais.net.cn/handle/2HMLN22E/136068]  
专题植物保护研究所_有害生物监测预警研究室
作者单位西安建筑科技大学信息与控制工程学院;中国农业科学院植物保护研究所
推荐引用方式
GB/T 7714
王超学,潘正茂,董丽丽,等. 基于改进SMOTE的非平衡数据集分类研究[J]. 计算机工程与应用,2012(02):184-187+245.
APA 王超学,潘正茂,董丽丽,马春森,&张星.(2012).基于改进SMOTE的非平衡数据集分类研究.计算机工程与应用(02),184-187+245.
MLA 王超学,et al."基于改进SMOTE的非平衡数据集分类研究".计算机工程与应用 .02(2012):184-187+245.
个性服务
查看访问统计
相关权益政策
暂无数据
收藏/分享
所有评论 (0)
暂无评论
 

除非特别说明,本系统中所有内容都受版权保护,并保留所有权利。


©版权所有 ©2017 CSpace - Powered by CSpace