基于生成式对抗网络的场景文字消除方法研究

CORC > 自动化研究所 > 中国科学院自动化研究所 > 模式识别国家重点实验室

题名	基于生成式对抗网络的场景文字消除方法研究
作者	边学伟
答辩日期	2020-06
文献子类	硕士
授予单位	中国科学院大学
授予地点	中国科学院自动化研究所
导师	叶军涛 ; 严冬明
关键词	文字消除图像修复图像分割生成式对抗网络文字检测
学位专业	计算机技术
英文摘要	基于图像的场景理解是计算机视觉主要研究问题之一。在很多应用中，文字是一种重要的场景信息载体。针对图像中的文字进行检测、识别或者消除有着重要的研究价值。文字消除作为一个非常细化的领域，目前并没有获得足够多相关学者的关注。目前针对文字消除任务，仅有数篇基于深度学习的相关工作。这些工作在处理真实数据时，表现得不尽如人意，主要表现为文字消除不彻底、消除结果视觉效果差等。这一方面是因为这些工作没有对文字的特殊性予以充分考虑；一方面是因为这些工作的网络设计还有待改进；另一方面在训练相关模型时，因为彼时还不存在基于真实数据的数据集，因而只能在合成数据集上做训练，限制了模型在真实数据上的表现。本文对文字消除领域现有的问题进行深入的思考，并做出自己的贡献，本文的主要研究内容可以归纳如下： 1. 本文提出一种基于文字笔画检测的文字消除算法。该算法构建的网络具有生成式对抗网络的基本框架，其中生成器由堆叠的文字笔画检测网络和文字笔画消除网络组成，鉴别器通过对SN PatchGAN 中的鉴别器进行针对文字消除任务的优化得到。 2. 针对目前还不存在满足文字消除任务要求的基于真实数据的数据集的情况，本文构建了满足上述条件的真实数据集。在构建数据集时，我们将图像中文字的语言种类，文字所在的场景，文字本身的颜色、字体等特征考虑入内，构建了一个足够多样性的数据集。实验结果表明，本文构建的数据集相比于现有的合成数据集更契合文字消除任务，本文提出的文字消除算法相对于现有算法表现出很强的优越性。
语种	中文
页码	82
内容类型	学位论文
源URL	[http://ir.ia.ac.cn/handle/173211/39173]
专题	自动化研究所_模式识别国家重点实验室
推荐引用方式 GB/T 7714	边学伟. 基于生成式对抗网络的场景文字消除方法研究[D]. 中国科学院自动化研究所. 中国科学院大学. 2020.

个性服务

查看访问统计

相关权益政策

暂无数据

收藏/分享

所有评论 (0)

[发表评论/异议/意见]

暂无评论

评论
权益异议
反馈意见

评注功能仅针对注册用户开放，请您登录

您对该条目有什么异议，请向管理员反馈。
内容：
Email：	*
单位:
验证码：	刷新

您在知识库使用过程中有什么好的想法或者建议可以反馈给我们。
标题：	*
内容：
Email：	*
验证码：	刷新

相关链接

CORC

联系我们