CORC  > 清华大学
流量内容词语相关度的网络热点话题提取
周亚东 ; 孙钦东 ; 管晓宏 ; 李卫 ; 陶敬 ; Zhou Yadong ; Sun Qindong ; Guan Xiaohong ; Li Wei ; Tao Jing
2010-06-09 ; 2010-06-09
关键词网络热点话题 流量内容 网络舆情分析 popular topic on Internet network traffic content Internet public opinion analysis TP391.1
其他题名Internet Popular Topics Extraction of Traffic Content Words Correlation
中文摘要针对网络舆情分析的需求,给出了网络热点话题定义及其形式化描述,分析了流量内容中热点词语与热点话题的关系,提出了流量内容中热点词语的相关度计算算法.在此基础上,采用基于高密度连接区域的密度聚类方法得到热点词语簇,结合热点词语簇相关的网页标题及网站地址信息,得出网络热点话题的属性描述.实验结果表明,该算法能够有效获取当前网络中的热点话题,话题提取有效率达到16.7%,为网络热点话题传播特性研究提供了基础.与Web挖掘、话题监测与跟踪方法相比,所提算法通过选取合适的数据源,能更大程度地还原网络用户行为,从而得到了更为准确的网络信息传播状况.; Aiming at the requirements of network public feeling analysis,the formal definition and description of the popular topic on Internet is presented,the relationship between hot words and popular topics is analyzed,and finally a hotpoint words correlation computing approach for extracting popular topics on Internet is introduced in traffic contents.Based on that,DBSCAN(Density-Based Spatical Clustering of Application with Noise) clustering algorithm is adopted to extract popular topics and formalized results are given.The test results show that this method has an availability of 16.7% in extracting Internet popular topics,which,compared to web mining and TDT(Topic Detection and Tracking),can provide a more suitable data source for effective recovery of Internet public opinions.; 国家自然科学基金资助项目(60574087); 国家高技术研究发展计划资助项目(2003AA142060)
语种中文 ; 中文
内容类型期刊论文
源URL[http://hdl.handle.net/123456789/58139]  
专题清华大学
推荐引用方式
GB/T 7714
周亚东,孙钦东,管晓宏,等. 流量内容词语相关度的网络热点话题提取[J],2010, 2010.
APA 周亚东.,孙钦东.,管晓宏.,李卫.,陶敬.,...&Tao Jing.(2010).流量内容词语相关度的网络热点话题提取..
MLA 周亚东,et al."流量内容词语相关度的网络热点话题提取".(2010).
个性服务
查看访问统计
相关权益政策
暂无数据
收藏/分享
所有评论 (0)
暂无评论
 

除非特别说明,本系统中所有内容都受版权保护,并保留所有权利。


©版权所有 ©2017 CSpace - Powered by CSpace