基于改进SMOTE的非平衡数据集分类研究 | |
王超学; 潘正茂; 董丽丽; 马春森; 张星 | |
刊名 | 计算机工程与应用 |
2012-01-16 | |
期号 | 02页码:184-187+245 |
关键词 | 非平衡数据集 分类 支持度 轮盘赌选择 合成少数过采样技术(SMOTE) |
英文摘要 | 针对SMOTE(SyntheticMinorityOver-samplingTechnique)在合成少数类新样本时存在的不足,提出了一种改进的SMOTE算法(SSMOTE)。该算法的关键是将支持度概念和轮盘赌选择技术引入到SMOTE中,并充分利用了异类近邻的分布信息,实现了对少数类样本合成质量和数量的精细控制。将SSMOTE与KNN(K-NearestNeighbor)算法结合来处理不平衡数据集的分类问题。通过在UCI数据集上与其他重要文献中的相关算法进行的大量对比实验表明,SSMOTE在新样本的整体合成效果上表现出色,有效提高了KNN在非平衡数据集上的分类性能。 |
URL标识 | 查看原文 |
语种 | 中文 |
内容类型 | 期刊论文 |
源URL | [http://ir.nais.net.cn/handle/2HMLN22E/136068] |
专题 | 植物保护研究所_有害生物监测预警研究室 |
作者单位 | 西安建筑科技大学信息与控制工程学院;中国农业科学院植物保护研究所 |
推荐引用方式 GB/T 7714 | 王超学,潘正茂,董丽丽,等. 基于改进SMOTE的非平衡数据集分类研究[J]. 计算机工程与应用,2012(02):184-187+245. |
APA | 王超学,潘正茂,董丽丽,马春森,&张星.(2012).基于改进SMOTE的非平衡数据集分类研究.计算机工程与应用(02),184-187+245. |
MLA | 王超学,et al."基于改进SMOTE的非平衡数据集分类研究".计算机工程与应用 .02(2012):184-187+245. |
个性服务 |
查看访问统计 |
相关权益政策 |
暂无数据 |
收藏/分享 |
除非特别说明,本系统中所有内容都受版权保护,并保留所有权利。
修改评论