题名基于机器学习的microRNA—靶标相互作用预测研究
作者黄利广
答辩日期2021-05-25
授予单位中国科学院大学
授予地点中国科学院新疆理化技术研究所
导师尤著宏
关键词生物信息学 相互作用预测 miRNA与靶标 信息相似性 网络表示算法
学位名称博士
学位专业计算机应用技术
英文摘要

中心法则描述了遗传信息的转移方向,RNA是DNA和蛋白质的重要桥梁。在人体内的生命活动中,存在着各种各样的RNA间相互作用,其中长度较短的非编码基因miRNA被研究发现其在各种生命活动中起着重要的调控作用,因此成为了研究的热点。通过miRNA介导的表达调控网络挖掘miRNA与靶标间潜在的分子机制这一关键科学问题亟需解决。研究miRNA与靶标间的相互作用有助于研究人员开拓更多未知的生命科学领域,进而促进生物医学的发展,为人类发现更多新的生物标志物和研究新的治疗方案铺平道路。通过高通量测序技术生物学实验验证miRNA与靶标间的相互作用,为各大数据库带来指数增长的生物数据。生物实验验证的方法在实际应用中各有优劣,但无法避免其过程耗费较高人力物力和时间成本。同时,由于RNA分子间有着高度复杂性和动态性,且实验结果复现性差,导致假阳率高。有研究表明,生物实验的设计结合计算机辅助预测的结果将是一种最优化的方案。计算机的预测算法能够“学习”RNA间活动的匹配模式。开发基于计算的预测算法多方面的意义,为生物实验研究人员提供借鉴制定更合理更高效的生物实验方案,提高实验的有效性,节省研究成本。miRNA-靶标相互作用预测算法研究是一个重要研究方向。基于机器学习的方法预测miRNA与靶标的相互作用关系的方法,能够将实验验证的相互作用的关系数据作为模型的输入,模型在训练的过程中能“学习”训练样本中的规则。针对不同的靶标与miRNA的相互作用研究,主流的基于机器学习的预测方法有所不同。本文针对目前miRNA-靶标相互作用预测研究的研究现状,提出更优的基于信息融合的链路模型预测miRNA-lncRNA相互作用关系,并构建基于网络特征表示学习的方法对miRNA和mRNA进行特征提取以提升模型预测性能。本文主要创新工作包括以下四个方面:(1) 在miRNA-lncRNA的相互作用预测研究中,一般基于矩阵分解的半监督学习预测模型,只针对单一的相互作用信息进行模型训练。本文提出结合额外的RNA信息进行模型训练,根据RNA信息的特性,构建RNA信息相似矩阵,将其与miRNA-lncRNA的相互作用网络进行融合得到RNA信息与相互作用信息的融合矩阵,然后训练基于结构微扰动的半监督学习预测模型,最后对待观察的关系对进行评估预测;(2) 基于相似的miRNA更有可能与同一个lncRNA产生相互作用相互作用,以RNA的信息相似矩阵为侧信息(辅助信息),构建信息融合矩阵,其行列都是包含miRNA/lncRNA关于其他顶点的信息如RNA间的信息相似信息和相互作用信息,通过建立基于线性优化的线性邻居表示模型进行预测,最终的预测效果相比已有的研究有着更强的性能;(3) 在miRNA-mRNA的相互作用研究中,有监督学习的框架主要由特征表示和模型训练两部分组成,特征表示(特征抽取)是否高效是训练好模型的重要前提。本文提出构建多种RNA分子与疾病间的大型生物分子关系网络,并利用网络表示特征学习算法DeepWalk学习得到miRNA与mRNA的潜在网络特征。同时,基于子序列统计信息特征的k-mer算法应用于提取miRNA与mRNA的序列特征。将两种特征级联后得到的训练样本作为模型的输入;(4) 在网络特征表示算法中,考虑到高阶信息隐含着某些潜在的节点间的信息,本文提出信息矩阵构建,将序列信息和相互作用信息(结构信息)进行融合,再构建高阶信息矩阵,多重高阶信息融合后,通过Auto-Encoder自动编码器无监督学习矩阵中的节点特征表示,训练得到的特征融合了miRNA和mRNA的相互作用信息和序列特征信息,以此作为二元分类模型训练的输入。在通用的模型预测性价评价下,本文所提出的基于机器学习算法的miRNA与靶标的相互作用预测算法,取得优异的结果。模型的有效性揭示了本文所提出的算法能作为后续生物实验研究的辅助工具,有着一定的应用价值,帮助人类探索更多生命科学的奥秘。

页码86
内容类型学位论文
源URL[http://ir.xjipc.cas.cn/handle/365002/7894]  
专题新疆理化技术研究所_多语种信息技术研究室
推荐引用方式
GB/T 7714
黄利广. 基于机器学习的microRNA—靶标相互作用预测研究[D]. 中国科学院新疆理化技术研究所. 中国科学院大学. 2021.
个性服务
查看访问统计
相关权益政策
暂无数据
收藏/分享
所有评论 (0)
暂无评论
 

除非特别说明,本系统中所有内容都受版权保护,并保留所有权利。


©版权所有 ©2017 CSpace - Powered by CSpace