题名基于深度结构化学习的手写数学公式识别
作者吴金文
答辩日期2021-12
文献子类博士
授予单位中国科学院大学
授予地点中国科学院自动化所
导师刘成林
关键词手写数学公式识别 配对对抗学习 预感知单元 图到图生成 字符原型
学位名称工学博士
学位专业模式识别与智能系统
英文摘要

手写数学公式的识别,对于教育、科学传播和自动化等领域都有着重要意 义。相比于一般的文字识别或者图像识别问题,手写数学公式版面复杂,内容多样。因此,手写数学公式的符号检测、符号分类以及结构关系推理等都非常具有挑战性。本文研究手写数学公式的识别以及结构解析问题,利用深度学习和结构化学习的思想提出了几种有效的模型和方法,在手写数学公式识别实验中取得了优良的性能。论文的主要创新工作如下:
1. 提出了一种基于配对对抗学习的手写数学公式识别方法。该方法用注意机力解码器神经网络从输入公式数据的视觉表示中解码出LaTeX 形式符号串表达,训练中以标准的印刷体数学公式作为模板,在训练模型关注手写体公式和印刷体模板上相同的字符的同时,采用对抗机制使得深度神经网络关注字符的语义不变特征,以增强模型对书写风格变化的鲁棒性。在手写公式识别的公开数据集上的实验中,该方法取得了有竞争力的结果。

2. 提出了一种基于预感知单元的手写数学公式识别方法。基于注意机制的隐式分割模型处理形似的符号或者复杂的结构时,常常对某一符号过注意或者欠注意,导致在识别过程中重复识别或者丢失符号。为了解决这一问题,该方法设计了一种基于预感知单元的解码器,将符号阅读过程的空间信息嵌入在注意机制中,使得识别器能够准确地并行学习每一个符号的视觉和语义对应关系。实验表明,该方法能有效提升手写数学公式识别的精度。


3. 提出了一种基于图到图生成的手写数学公式识别和结构解析方法。该方法将输入手写数学公式数据和输出结构化表示均表示为图结构,在端到端识别联机手写数学公式的同时,探索手写数学公式的层次结构建模和解析。实验结果表明,该方法显著地刷新了多个公开数据集上的识别精度,并且可显式地分割出联机手写数学公式中的数学符号。同时,该方法在脱机数学公式上也展现出良好的拓展性。


4. 提出了一种基于字符原型的弱监督图到图联机手写数学公式识别方法。为了克服图到图生成模型训练过程中对大规模字符级标注数据的依赖,该方法先在封闭的字符集上学习数学符号的原型,结合字符原型进行符号的分割与分类,再利用数学公式的公式级弱标记学习公式符号间的层次结构和上下文信息。实验结果表明,该方法在弱监督的条件下,在多个公开数据集上都取得了有竞争力的结果。

 

语种中文
页码124
内容类型学位论文
源URL[http://ir.ia.ac.cn/handle/173211/47472]  
专题自动化研究所_模式识别国家重点实验室_模式分析与学习团队
通讯作者吴金文
推荐引用方式
GB/T 7714
吴金文. 基于深度结构化学习的手写数学公式识别[D]. 中国科学院自动化所. 中国科学院大学. 2021.
个性服务
查看访问统计
相关权益政策
暂无数据
收藏/分享
所有评论 (0)
暂无评论
 

除非特别说明,本系统中所有内容都受版权保护,并保留所有权利。


©版权所有 ©2017 CSpace - Powered by CSpace