题名基于生成式对抗网络的场景文字消除方法研究
作者边学伟
答辩日期2020-06
文献子类硕士
授予单位中国科学院大学
授予地点中国科学院自动化研究所
导师叶军涛 ; 严冬明
关键词文字消除 图像修复 图像分割 生成式对抗网络 文字检测
学位专业计算机技术
英文摘要

基于图像的场景理解是计算机视觉主要研究问题之一。在很多应用中,文字是一种重要的场景信息载体。针对图像中的文字进行检测、识别或者消除有着重要的研究价值。
文字消除作为一个非常细化的领域,目前并没有获得足够多相关学者的关注。目前针对文字消除任务,仅有数篇基于深度学习的相关工作。这些工作在处理真实数据时,表现得不尽如人意,主要表现为文字消除不彻底、消除结果视觉效果差等。这一方面是因为这些工作没有对文字的特殊性予以充分考虑;一方面是因为这些工作的网络设计还有待改进;另一方面在训练相关模型时,因为彼时还不存在基于真实数据的数据集,因而只能在合成数据集上做训练,限制了模型在真实数据上的表现。
本文对文字消除领域现有的问题进行深入的思考,并做出自己的贡献,本文的主要研究内容可以归纳如下:
1. 本文提出一种基于文字笔画检测的文字消除算法。该算法构建的网络具有生成式对抗网络的基本框架,其中生成器由堆叠的文字笔画检测网络和文字笔画消除网络组成,鉴别器通过对SN PatchGAN 中的鉴别器进行针对文字消除任务的优化得到。
2. 针对目前还不存在满足文字消除任务要求的基于真实数据的数据集的情况,本文构建了满足上述条件的真实数据集。在构建数据集时,我们将图像中文字的语言种类,文字所在的场景,文字本身的颜色、字体等特征考虑入内,构建了一个足够多样性的数据集。
实验结果表明,本文构建的数据集相比于现有的合成数据集更契合文字消除任务,本文提出的文字消除算法相对于现有算法表现出很强的优越性。

语种中文
页码82
内容类型学位论文
源URL[http://ir.ia.ac.cn/handle/173211/39173]  
专题自动化研究所_模式识别国家重点实验室
推荐引用方式
GB/T 7714
边学伟. 基于生成式对抗网络的场景文字消除方法研究[D]. 中国科学院自动化研究所. 中国科学院大学. 2020.
个性服务
查看访问统计
相关权益政策
暂无数据
收藏/分享
所有评论 (0)
暂无评论
 

除非特别说明,本系统中所有内容都受版权保护,并保留所有权利。


©版权所有 ©2017 CSpace - Powered by CSpace