公共数字文化平台资源个性化推荐技术研究

CORC > 自动化研究所 > 中国科学院自动化研究所 > 毕业生 > 硕士学位论文

题名	公共数字文化平台资源个性化推荐技术研究
作者	叶墅锋1,2
答辩日期	2018-05-30
授予单位	中国科学院研究生院
授予地点	北京
导师	王健
关键词	公共数字文化资源 Lda 个性化推荐协同过滤推荐标签融合时间加权
英文摘要	公共数字文化资源具有数据量大、分类复杂和同质性强的特点，用户难以在海量的资源中高效地发现真正感兴趣的资源。个性化推荐能够捕捉用户兴趣，并主动向用户推荐喜欢的资源，是解决上述问题的关键技术。本文针对传统协同过滤方法在公共数字文化共享服务领域所遇到的用户文化行为数据高维稀疏性问题和用户文化兴趣变化快的问题，基于公共数字文化资源语义分析的特点和推荐算法的特点，提出两种协同过滤推荐算法的优化方法，通过实验验证本文提出方法对解决上述问题的有效性。本文主要工作及成果如下：分析了公共数字文化资源的特点；对比了不同的个性化推荐算法的优缺点；结合公共数字文化资源的特点，确定协同过滤推荐为研究对象，研究公共数字文化的个性化推荐。提出了融合主题模型和词向量模型的公共数字文化资源语义标注技术，实现了从公共数字文化资源的少量元数据中提取语义标签。该技术包含基于LDA模型文化资源内容主题分析算法，用于提取语义标签；以及基于深度神经网络模型Word2Vec方法，用于扩展资源语义标签。由此构建公共文化资源的标签库，为之后的个性化推荐算法的优化提供数据支撑。提出了两种用于个性化推荐的优化方法：一种是基于标签融合的协同过滤推荐，通过构建用户-标签的评分得到低维空间数据的方法来帮助解决数据稀疏性难题；另一种是基于时间加权的协同过滤推荐算法，通过引入指数形式时间衰减函数，来确定用户时间权重系数，进而调整用户-资源评分，帮助解决用户兴趣随时间变化问题。研发了公共数字文化资源个性化推荐系统，设计了系统的输入输出模块、数据分析模块、推荐引擎模块和模型评估模块，并通过API接口为公共数字文化共享服务平台提供个性化推荐分析的功能，支撑该平台为用户推荐感兴趣的数字文化资源。本文使用自然语言处理领域的LDA模型和Word2Vec模型对公共数字文化资源进行语义分析，并将分析结果融合与推荐算法相融合，提出了基于公共数字文化资源语义标签融合的公共数字文化用户行为数据降维方法，以及基于公共数字文化用户行为时间感知的评分加权加权方法。本文通过实验验证了此两种方法的准确性和有效性，为公共数字文化资源分析和平台优化提供了有效的技术途径，对推动公共文化资源建设具有重要意义。论文取得的创新点如下：提出一种融合主题模型和词向量模型的公共数字文化资源语义标注技术，用于实现从公共数字文化资源的少量元数据中提取语义标签，并由此构建文化资源的标签库，为个性化推荐算法的优化提供基础；提出一种基于公共数字文化资源语义聚合的公共数字文化用户行为数据的降维方法，该方法通过构建用户-标签评分矩阵，得到低维空间数据，有效的降低了协同过滤推荐算法中数据的由高稀疏性问题所带来的影响；提出一种基于公共数字文化用户行为时间感知的评分加权方法，该方法通过时间指数函数确定用户时间权重系数。基于此调整用户-资源评分矩阵，进而帮助解决协同过滤推荐中用户兴趣变化问题。
内容类型	学位论文
源URL	[http://ir.ia.ac.cn/handle/173211/20946]
专题	毕业生_硕士学位论文
作者单位	1.中国科学院大学 2.中国科学院自动化研究所
推荐引用方式 GB/T 7714	叶墅锋. 公共数字文化平台资源个性化推荐技术研究[D]. 北京. 中国科学院研究生院. 2018.