基于语句-词条矩阵的聚簇式动态增长聚类算法 | |
孙辉; 陈晓云; 马志新 | |
刊名 | 清华大学学报(自然科学版)
![]() |
2005-12-30 | |
卷号 | 45期号:S1页码:1814-1817 |
关键词 | 文档聚类 词频和反向词频 语句词条矩阵 文档矩阵集合 Document clustering Document matrix sets Dynamic growing clustering Inverse document frequency Plane partition algorithms Sentence words matrices Term frequency Web information |
ISSN号 | 1000-0054 |
其他题名 | Clustering-dynamic-growing clustering algorithm based on sentence-words matrix |
通讯作者 | Sun, H. |
中文摘要 | W eb信息在以指数级的速度增长,然而传统搜索引擎的检索方式难以使用户找到精简而准确的信息。为此该文提出了一种基于语句词条矩阵的聚簇式动态增长聚类算法。该平面分割的算法的整个工作过程有3个步骤:预处理W eb数据,进行文本摘取和过滤处理;形成每个文档的语句词条矩阵,构成若干文档的矩阵集合;通过聚簇式动态增长聚类算法,对相似文档进行聚类。对该算法进行了实验分析。结果表明,该算法在保持文档语义联系的同时,其对文档的聚类有较高的准确性。 |
学科主题 | Telecommunication; Radar, Radio and Television; Data Processing and Image Processing; Database Systems; Computer Applications; Information Dissemination;Mathematics |
出版地 | Beijing |
语种 | 中文 |
内容类型 | 期刊论文 |
源URL | [http://ir.lzu.edu.cn/handle/262010/127370] ![]() |
专题 | 信息科学与工程学院_期刊论文 |
推荐引用方式 GB/T 7714 | 孙辉,陈晓云,马志新. 基于语句-词条矩阵的聚簇式动态增长聚类算法[J]. 清华大学学报(自然科学版),2005,45(S1):1814-1817. |
APA | 孙辉,陈晓云,&马志新.(2005).基于语句-词条矩阵的聚簇式动态增长聚类算法.清华大学学报(自然科学版),45(S1),1814-1817. |
MLA | 孙辉,et al."基于语句-词条矩阵的聚簇式动态增长聚类算法".清华大学学报(自然科学版) 45.S1(2005):1814-1817. |
个性服务 |
查看访问统计 |
相关权益政策 |
暂无数据 |
收藏/分享 |
除非特别说明,本系统中所有内容都受版权保护,并保留所有权利。
修改评论