最大频繁项集挖掘中搜索空间的剪枝策略 | |
马志新; 陈晓云; 王雪; 李龙杰 | |
刊名 | 清华大学学报(自然科学版)
![]() |
2005-12-30 | |
卷号 | 45期号:S1页码:1748-1752 |
关键词 | Web挖掘 最大频繁项集 剪枝策略 搜索空间 Depth first traversal Enumeration trees Lexicographic subsets Maximal frequent itemsets Pruning strategy Search space Sparse datasets Web mining |
ISSN号 | 1000-0054 |
其他题名 | Pruning strategy for mining maximal frequent itemsets |
通讯作者 | Ma, Z. (mazhx@lzu.edu.cn) |
中文摘要 | 最大频繁项集挖掘可以广泛应用在多种重要的W eb挖掘工作中。为了有效地削减搜索空间,提出了一种新的最大频繁项集挖掘中的搜索空间剪枝策略。这种策略基于深度优先遍历词典序子集枚举树,利用树中子节点与父节点扩展集中相同项的扩展支持度相等的特性,对搜索空间进行剪枝。应用该策略,对M AF IA算法进行改进优化。实验结果表明,该剪枝策略可以有效削减搜索空间,尤其在稀疏但包含长频繁项集的数据集上,搜索空间削减掉2/3,算法的时间效率比原M AF IA算法提高3~5倍。 |
学科主题 | Telecommunication; Radar, Radio and Television; Data Processing and Image Processing; Database Systems; Combinatorial Mathematics, Includes Graph Theory, Set Theory; Optimization Techniques |
出版地 | Beijing |
语种 | 中文 |
内容类型 | 期刊论文 |
源URL | [http://ir.lzu.edu.cn/handle/262010/127366] ![]() |
专题 | 信息科学与工程学院_期刊论文 |
推荐引用方式 GB/T 7714 | 马志新,陈晓云,王雪,等. 最大频繁项集挖掘中搜索空间的剪枝策略[J]. 清华大学学报(自然科学版),2005,45(S1):1748-1752. |
APA | 马志新,陈晓云,王雪,&李龙杰.(2005).最大频繁项集挖掘中搜索空间的剪枝策略.清华大学学报(自然科学版),45(S1),1748-1752. |
MLA | 马志新,et al."最大频繁项集挖掘中搜索空间的剪枝策略".清华大学学报(自然科学版) 45.S1(2005):1748-1752. |
个性服务 |
查看访问统计 |
相关权益政策 |
暂无数据 |
收藏/分享 |
除非特别说明,本系统中所有内容都受版权保护,并保留所有权利。
修改评论