题名宽度神经架构搜索
作者丁子祥
答辩日期2021-11
文献子类博士
授予单位中国科学院大学人工智能学院
授予地点中国科学院自动化研究所智能化大厦三层
导师赵冬斌
关键词神经架构搜索 宽度卷积神经网络 宽度神经架构搜索
学位名称工学博士
学位专业计算机应用技术
英文摘要

近年来,深度学习在多个领域取得了巨大的成功,其中深度模型的设计发挥
着至关重要的作用。因此,许多优秀的手工设计模型被相继提出,并取得了极高
的性能。然而,手动地设计模型是一个既耗时又易出错的过程。为了能够自动地
设计网络结构,神经架构搜索应运而生。然而,最初的神经架构搜索方法需要极
大的计算代价。为此,相关研究人员通过改进搜索空间、搜索策略以及性能评估
提出了许多高效的神经架构搜索方法。目前,所有的神经架构搜索方法均采用具
有深度拓扑结构的搜索空间,以发现高性能结构。然而,深度搜索空间在搜索过
程中存在两个问题:1) 单步训练时间长:神经架构搜索方法需要更多的时间通过
代理数据集对搜索空间进行训练;2) 内存效率低下:在一个特定的计算设备上,
神经架构搜索无法同时处理更多的训练数据。将搜索空间的拓扑结构变浅可以
有效地解决上述两个问题,但会因搜索、评估两阶段的模型差异过大而导致性能
下降。
宽度学习系统利用较浅的宽度拓扑结构取得了与深度网络类似甚至更高的
性能,能够很好地解决上述问题。受到宽度学习系统的启发,本文提出了三种高
效的宽度神经架构搜索方法,能够在提升神经架构搜索搜索效率的同时兼顾所
得模型的性能。首先,通过设计三种宽度搜索空间解决深度搜索空间中存在的两
个问题,并采用基于策略梯度的强化学习算法对其进行优化;其次,利用连续松
弛策略将宽度神经架构搜索映射到连续搜索空间,从而进一步提升其搜索效率;
然后,对宽度搜索空间进行重新设计,并通过提前停止策略进一步提升其搜索效
率;最后,通过CIFAR-10 和ImageNet 数据集对三种宽度神经架构搜索算法的性能进行了验证。本文的贡献总结如下:
1 基于宽度卷积神经网络的宽度神经架构搜索
针对深度搜索空间存在的两个问题,提出了宽度搜索空间——宽度卷积神
经网络。该搜索空间能够通过较浅的拓扑结构取得与深度搜索空间类似甚至更
高的分类性能。其中,多尺度信息融合及知识嵌入能够有效地提升宽度卷积神经
网络的性能。此外,在宽度搜索空间的基础上,结合基于策略梯度的强化学习方
法提出了宽度神经架构搜索——BNAS-v1。实验结果显示:BNAS-v1 的搜索效率在基于强化学习的神经架构搜索方法中排名第一,且所得模型具有较高的分
类性能。
2 可微分的宽度神经架构搜索
针对搜索过程中存在的不公平训练问题,提出了可微分的宽度神经架构搜
索——BNAS-v2。通过连续松弛策略同时更新所有候选子网络,从而解决单路径
采样-更新优化方式产生的不公平训练问题,进而进一步提升宽度神经架构搜索
的效率。此外,为了缓解连续松弛导致的性能崩塌问题,提出了置信学习率并同
时引入了部分通道连接策略。实验结果显示:与BNAS-v1 相比,BNAS-v2 在效
率提升4 倍的前提下,取得了更高的分类精度。
3 堆叠式宽度神经架构搜索
针对宽度卷积神经网络中存在的尺度信息多样性丢失以及知识嵌入设计耗
时问题,提出了堆叠式BNAS。一方面,在宽度卷积神经网络的基础上,设计了
一种能够保存所有尺度信息的堆叠式宽度卷积神经网络。另一方面,提出了一种
可微分的知识嵌入搜索算法以解决手工设计知识嵌入耗时的问题。实验结果显
示:堆叠式宽度卷积神经网络能够取得比原始宽度卷积神经网络更高的分类性
能;知识嵌入搜索算法能够有效地消除手工知识嵌入中的冗余信息,从而能够在
保证模型精度的前提下降低参数量。

语种中文
页码140
内容类型学位论文
源URL[http://ir.ia.ac.cn/handle/173211/46582]  
专题复杂系统管理与控制国家重点实验室_深度强化学习
推荐引用方式
GB/T 7714
丁子祥. 宽度神经架构搜索[D]. 中国科学院自动化研究所智能化大厦三层. 中国科学院大学人工智能学院. 2021.
个性服务
查看访问统计
相关权益政策
暂无数据
收藏/分享
所有评论 (0)
暂无评论
 

除非特别说明,本系统中所有内容都受版权保护,并保留所有权利。


©版权所有 ©2017 CSpace - Powered by CSpace