CORC  > 自动化研究所  > 中国科学院自动化研究所  > 毕业生  > 硕士学位论文
题名基于跨平台话题关联挖掘的媒体转载模式分析研究
作者王林子
答辩日期2023-05-21
文献子类硕士
关键词跨平台媒体转载模式请输入关键词 预训练编码 话题转载 热转段落 转载类型
英文摘要

移动互联网的革新催生了以微博、微信公众号等为代表的新型媒体,与传统门户网站共同作为新融媒体时代背景下新闻信息发布与传播复合式平台的重要组成部分。深入、细致、全面分析跨平台媒体转载模式有助于理解媒体转载动因,预判社会热点关注发展趋势,评估媒体传播影响力,从而为相关管理部门提供辅助决策支持。本文在现有媒体转载分析研究基础上,借鉴预训练文本表示学习、异质网络表示学习等领域的研究成果,分析跨平台媒体关注话题以建立话题关联,围绕热点转载段落预测、媒体转载类型识别深入开展媒体转载模式的分析研究。主要工作内容总结如下:

1.   基于站点关联增强的跨平台媒体关注话题转载预测方法。跨平台媒体站点历史转载交互关系蕴含媒体对关注话题的追踪过程,为有效融合媒体交互信息与历史发布内容,生成语义多元化、异质性的媒体、话题表征,本文提出基于站点关联增强的跨平台媒体关注话题转载预测方法。该方法首先构建基于跨平台媒体站点间交互关系的异质关联网络,并学习媒体站点向量表征;进而将其作为注意力机制来源引导编码历史发布内容,建模具有跨平台关联属性与深层语义信息的媒体新闻内容表征;最终利用交互注意力机制融合媒体新闻内容,生成语义多元化的媒体-话题融合表征,预测话题转载。实验表明,站点节点表征引导的层次-交互注意力机制能够充分利用网络关联关系,多角度、有侧重融合媒体历史发布新闻内容,便于更好地预测未来媒体-话题间转载关系。

2       基于风格增强-多视角关联建模的热点转载段落预测方法。新闻热点转载段落通常与新闻标题具有密切的语义关联性、高度的写作风格一致性。针对如何利用写作风格特征辅助挖掘标题-段落间深层语义关联的挑战性问题,本文提出基于风格增强-多视角关联建模的热点转载段落预测方法。该方法利用多头Transformer层将写作风格标签同新闻标题与候选段落的预训练语义表征进行融合以增强表征语境性;进而提出维度转换层从多个潜在视角计算标题与各候选段落语义向量对间的相关性得分,预测段落被转载概率值;最终协同使用交叉熵-排序损失函数,引导模型准确预测热点转载段落。实验表明,写作风格特征能够辅助挖掘新闻标题-候选热转段落对间多视角关联性,有助于识别热点转载段落潜在特征从而将其准确预测。

3       基于双编码-多粒度语义要素交互的媒体转载类型识别方法。新闻转载过程中存在单词变体、句子改写、篇章重述等多种转载类型,与词语、句子、段落等粒度语义要素的新闻摘编、转述息息相关。针对如何有效建模并融合转载新闻对在不同层级粒度的语义要素交互信息的挑战性问题,本文提出基于双编码-多粒度语义要素交互的媒体转载类型识别方法。该方法首先联合word2vecBERT双编码器分别学习新闻在词语、句子、段落等层级粒度的语义表征;进而建模新闻对的多粒度语义要素交互关联矩阵,经池化操作后获取相应粒度的交互语义表征;最终,融合各粒度语义要素交互信息得到转载新闻对关联表示向量,捕获深层语义关联,识别媒体转载类型。实验表明,从多粒度挖掘转载新闻对间语义要素交互关联性能够全面、细致捕获转载行为特征,从而提升媒体转载类型的识别性能。

语种中文
页码94
内容类型学位论文
源URL[http://ir.ia.ac.cn/handle/173211/51855]  
专题毕业生_硕士学位论文
推荐引用方式
GB/T 7714
王林子. 基于跨平台话题关联挖掘的媒体转载模式分析研究[D]. 2023.
个性服务
查看访问统计
相关权益政策
暂无数据
收藏/分享
所有评论 (0)
暂无评论
 

除非特别说明,本系统中所有内容都受版权保护,并保留所有权利。


©版权所有 ©2017 CSpace - Powered by CSpace