CORC  > 自动化研究所  > 中国科学院自动化研究所  > 毕业生  > 博士学位论文
题名基于神经科学文献感兴趣片段的跨物种脑认知知识图谱自动构建
作者朱洪银
答辩日期2020-06
文献子类博士
授予单位中国科学院大学
授予地点中国科学院自动化研究所
导师曾毅
关键词脑科学 跨物种 神经信息学 知识图谱 知识引擎 感兴趣片段 语料标注 术语识别 关系抽取 深度学习
学位名称工学博士
学位专业模式识别与智能系统
英文摘要

人类历史上对脑科学的探索从没有间断过,大脑被认为是人类智慧的来源,也是人体最复杂、最神秘的器官。这个器官在各种生物的生命中都发挥着至关重要的作用。随着信息化时代的发展,越来越多的方法被应用于探索大脑结构和功能,研究脑科学中的重大问题。已有的方法主要依靠神经影像学和生物实验,来观察大脑的活动,以及研究大脑和认知功能之间的关系,但这类方法需要花费大量的时间和成本。近年来,研究学者们在脑科学领域积累了大量的科研成果。与脑科学相关的文献高达两百多万篇,脑科学的研究成果日新月异。脑科学领域积累了海量的文献,然而这些科学文献并没有得到高效、充分地利用,而且跨物种的脑科学研究工作相对较少。在此背景下,本文首次探索了基于海量神经科学文献的跨物种脑认知知识图谱自动构建问题,为类脑智能和脑科学研究提供实际的支撑。该研究工作对于提高知识获取的效率,获得创新性科学发现,促进脑科学的发展都具有重要的理论意义和应用价值。

本文从脑科学研究过程中遇到的挑战以及脑科学的特点出发,研究了构建跨物种脑科学知识图谱过程中遇到的问题。论文的主要工作和创新点归纳如下:

1. 提出一种基于感兴趣片段的脑科学文献物种分类方法。

脑科学研究包含多种多样的物种,然而海量的脑科学知识没有按照物种组织起来,都混乱在一起。使得研究人员和文献分析系统无法区分知识来源于什么物种,也无法进行跨物种研究。本文发现有半数文献的摘要没有提到物种。该问题是个多标签分类问题,已有的方法通常会将文档编码为一个向量进行分类,局限性在于需要使用阈值决定最终标签子集,而且这种方法不够灵活,因为每个物种往往从文献中的不同部分得来。本文提出了一个生成式模型,通过关注文献中的感兴趣片段,适应性地生成物种标签,让每个标签可以灵活地关注文献的不同部分。此外,本文提出层级注意力解码机制,融合了文档的语篇章节结构,取得了明显的效果提升。本文标注了三个脑科学领域物种分类数据集,并且提出了两套语料标注标准。此外,本文提出的方法能区分物种是否为主要的实验对象,从而可以缓解跨物种知识获取问题。

2. 提出一种基于感兴趣实体增强的命名实体识别方法。

对于生物实验和脑科学文献分析,识别术语是比较基础的一步。基于深度学习的方法在通用领域取得了不错的效果,然而这些方法大都依赖于大量的训练数据,而且仅仅利用了固定的实体—上下文搭配。脑科学研究面临的主要是低资源的问题。标注脑科学领域的语料库需要邀请领域专家,这大大提高了数据标注的难度。本文提出了一种基于感兴趣实体增强的命名实体识别方法、双侧神经网络结构以及模型训练方法。本文在2个生物医学数据集和不同语言的数据集上都提升了模型的性能,尤其是在低资源数据集上提升更为明显。本文标注了一个脑科学术语识别语料库,标注了六大类实体(认知功能、脑区、脑疾病、神经元、蛋白质、神经递质),并且提出了一个语料标注的准则。本文的模型在脑科学术语识别任务上也取得了效果的提升。

3. 提出一种基于成对感兴趣实体的模块化神经网络关系抽取方法。

脑认知关系抽取旨在从脑科学文献中,抽取出脑区之间的功能性连接。已有的模型在信息抽取任务中取得了不错的效果。脑科学是一个探索性的领域,有许多脑区连接尚未定论,也有许多机理尚未知晓。已有的研究模式在脑科学领域的应用和研究上存在局限性。流水线方法局限性在于,它们将实体识别和关系抽取的过程分离,无法联合学习。本文提出一种级联推理学习的方法和共享表示机制来实现端到端的实体关系联合抽取。本文利用自注意力机制建模成对感兴趣实体进行关系分类。本文在4个公开数据集上取得了效果的提升。本文总结了常见的4类关系抽取协议,并且提出了一个模块化神经网络,设计了4种信息流将不同的关系抽取协议适应性地集成起来,从而缓解研究模式的局限性。本文基于已有的知识采用远程监督的方法标注了一个脑认知关系数据集,本文的方法在该数据集上也取得了效果的提升。

对于脑科学研究,知识、数据和服务的价值往往比对模型的改进更受关注。本文的研究旨在从文献中抽取出结构化知识,用于帮助神经科学家、生物学家、文献情报分析研究学者。本文抽取出跨物种脑认知知识图谱,融入脑科学知识引擎体系中,实现了能够进行跨物种脑认知研究的脑科学知识引擎,并总结了研究中遇到的关键问题和应对策略。本文通过脑科学知识引擎的在线服务与神经科学研究学者建立联系,通过互联网让用户可以随时随地访问该系统,促进脑科学研究领域的发展。本文最后绘制了25张跨物种脑功能图谱,包括在不同物种上的“工作记忆”、“导航”、“嗅觉”、“社会关系”等认知功能。

语种中文
页码176
内容类型学位论文
源URL[http://ir.ia.ac.cn/handle/173211/39296]  
专题毕业生_博士学位论文
推荐引用方式
GB/T 7714
朱洪银. 基于神经科学文献感兴趣片段的跨物种脑认知知识图谱自动构建[D]. 中国科学院自动化研究所. 中国科学院大学. 2020.
个性服务
查看访问统计
相关权益政策
暂无数据
收藏/分享
所有评论 (0)
暂无评论
 

除非特别说明,本系统中所有内容都受版权保护,并保留所有权利。


©版权所有 ©2017 CSpace - Powered by CSpace