CORC  > 厦门大学  > 软件学院-学位论文
题名基于KNN的文本分类特征选择与分类算法的研究与改进; Research and Improvement on Feature Selection and Classification Algorithms for Text Classification Based on KNN
作者黄娟娟
答辩日期2014 ; 2014
导师董槐林
关键词文本分类 蚁群优化算法 TF-RFIDF KNN算法 Text Classification Ant Colony Optimization TF-RFIDF KNN Algorithm
英文摘要随着信息技术的迅猛发展和日益普及,文本信息呈现指数级增长。文本分类作为管理大量信息的重要技术,能有效地解决信息混杂的难题,同时能够让用户更准确地检索信息,在信息过滤与检索、邮件分类和话题跟踪等方面有很高的应用价值,是数据挖掘领域的热点技术。 本文以提高KNN分类器性能为主要目标,简要阐述文本分类定义、文本预处理、特征选择、特征加权、分类方法和分类性能评估等,并且针对特征选择、特征加权、分类方法进行了深入研究并加以改进。 (1)提出了基于蚁群优化算法的特征选择。通过设计适应度函数、转移规则和信息素更新等,可以有效排除关联特征和冗余特征,降低计算的空间与时间,提高计算精度,从而提高分类性能。 ...; With the rapid development and information technology, the text information increases exponentially. As an important technology of managing large amount of information, text classification is able to solve the problem of chaotic information effectively. Meanwhile, it’s convenient for user to retrieve the required information accurately. Consequently, the text classification possesses high value of...; 学位:工学硕士; 院系专业:软件学院_计算机软件与理论; 学号:24320111152279
语种zh_CN
出处http://210.34.4.13:8080/lunwen/detail.asp?serial=43922
内容类型学位论文
源URL[http://dspace.xmu.edu.cn/handle/2288/83679]  
专题软件学院-学位论文
推荐引用方式
GB/T 7714
黄娟娟. 基于KNN的文本分类特征选择与分类算法的研究与改进, Research and Improvement on Feature Selection and Classification Algorithms for Text Classification Based on KNN[D]. 2014, 2014.
个性服务
查看访问统计
相关权益政策
暂无数据
收藏/分享
所有评论 (0)
暂无评论
 

除非特别说明,本系统中所有内容都受版权保护,并保留所有权利。


©版权所有 ©2017 CSpace - Powered by CSpace