非对称哈希学习方法研究

CORC > 自动化研究所 > 中国科学院自动化研究所 > 模式识别国家重点实验室 > 遥感图像处理团队

题名	非对称哈希学习方法研究
作者	达铖
答辩日期	2019-05-21
文献子类	博士
授予单位	中国科学院大学
授予地点	中国科学院自动化研究所
导师	向世明 ; 孟高峰
关键词	哈希学习非对称哈希二值编码多值编码深度学习监督学习无监督学习
学位名称	工学博士
学位专业	模式识别与智能系统
英文摘要	信息技术的高速发展推动全球数据总量的急剧攀升。在大数据时代中，信息检索由于高额的计算和存储开销面临巨大挑战。因此，如何快速、高效且精确地从海量数据中检索出特定样本是当前机器学习领域的研究热点。哈希学习作为一种常用的近似最近邻搜索方法，凭借其高效的检索效率和低额的存储消耗受到了研究者的广泛关注。非对称哈希学习方法构建不同的哈希函数来分别编码数据库样本和查询样本。因其灵活的编码机制、优异的检索性能和高效的优化方式，非对称哈希学习方法成为当前哈希学习领域的研究热点。本文开展非对称哈希学习方法相关研究，取得若干成果。论文的主要贡献包含以下几个方面：提出了一种基于度量嵌入的非对称哈希学习方法。该方法的核心思想是采用非对称编码策略来减少数据库样本的量化损失，同时保留查询样本的实数值信息。具体地，论文构建一种无监督非对称哈希学习模型，采用实数值编码和二值编码分别表示查询样本和数据库样本，并使用双线性函数来度量非对称编码间的相似性，然后嵌入至哈希学习过程中。实验结果表明所提方法的检索性能优于传统的无监督哈希学习方法。提出了一种非对称多值哈希学习方法。该方法的核心思想是采用多整数值编码和实数值编码来分别表征数据库样本和查询样本。具体地，论文构建了一个多整数值约束的非对称哈希学习模型，并通过二值稀疏表示将其转化为一个易于优化的混合整数规划问题。在监督学习框架下，学习得到具有优异相似度保持性能的非二值编码，并在维持高效查询和低耗存储的同时提高检索精度。对比实验结果验证了所提方法的有效性。提出了一种非线性非对称多值哈希学习方法。该方法的核心思想是在非对称多值哈希的框架下利用神经网络来实现查询样本的实数值映射。为此，论文提出了一种交替优化策略来实现对神经网络参数的学习和混合整数规划问题的高效求解。在此基础上，提出了一种数据库增量扩充方法来解决数据库样本更新问题。同时，从理论上指出非对称多值哈希学习方法中的距离度量本质上是一种查询敏感的加权汉明距离度量。对比实验结果验证了所提方法的有效性。提出了一种深度无监督图哈希学习方法。该方法的核心思想是将图哈希学习方法与深度神经网络训练融合到统一的学习框架中。具体地，提出了一种非对称谱损失来保持深度神经网络的输出与二值编码间的局部近邻结构关系。在此框架下，利用全局图拉普拉斯构建小批量样本梯度来驱动深度神经网络参数的学习，并从全局保持样本间的亲和度关系。为此，提出了一种高效优化算法交替完成深度神经网络的训练和离散二值编码的优化。实验结果表明所提方法优于现有的无监督哈希学习方法。
语种	中文
学科主题	模式识别 ; 计算机神经网络
页码	132
内容类型	学位论文
源URL	[http://ir.ia.ac.cn/handle/173211/23842]
专题	自动化研究所_模式识别国家重点实验室_遥感图像处理团队毕业生_博士学位论文
推荐引用方式 GB/T 7714	达铖. 非对称哈希学习方法研究[D]. 中国科学院自动化研究所. 中国科学院大学. 2019.