复杂驾驶场景下协同式的人眼检测及视线估计方法研究

CORC > 自动化研究所 > 中国科学院自动化研究所 > 毕业生 > 硕士学位论文

题名	复杂驾驶场景下协同式的人眼检测及视线估计方法研究
作者	曹琳
答辩日期	2019
文献子类	硕士
授予单位	中国科学院大学
授予地点	中国科学院自动化研究所
导师	熊刚 ; 苟超
关键词	复杂驾驶场景级联联合回归堆叠沙漏网络人眼检测视线协同估计
学位专业	工学
英文摘要	为了减少交通事故，驾驶监测技术研究引起了学术界的广泛关注。人眼检测及视线估计是驾驶监测研究的重要组成部分，开展复杂驾驶场景下的人眼检测及视线估计方法研究具有重要意义。目前，在特定环境或环境可控时，人眼检测及视线估计的方法和成果已有很多。但是，对于复杂驾驶场景，光照不均、距离变化、背景杂乱、姿态偏转、表情变化等因素增加了检测人眼及视线的难度；现有模型没有考虑人眼关键点和视线之间的关系；过多关注模型精度而忽略了模型参数量等问题，都限制了人眼检测及视线估计的实际应用和推广。本论文以复杂驾驶场景下驾驶员眼睛为研究对象，对人眼检测及视线估计方法进行了较为深入的研究与分析，针对其中的关键问题和难点，提出相应的解决方法。主要研究内容如下：首先，本文研究了复杂驾驶场景下基于面部关键点的眼睛区域定位。针对图像中直接定位眼睛区域准确度低的情况，本文在人脸检测算法的基础上，先对人脸进行检测，然后基于脸部区域进行人脸关键点定位，之后根据关键点相对位置提取眼部区域。该方法简单有效且易于实现，实验结果表明在光照变化、部分遮挡的场景下仍可以获取眼睛区域。接着，本文提出基于级联联合回归模型的协同式人眼检测及视线估计。针对人眼区域内人眼关键点和视线之间的关系建模问题，本文提出级联联合回归模型，利用多特征融合策略实现二者之间的协同关系建模，同时实现人眼检测和视线估计任务。在多种测试数据集上的结果显示，当检测误差在瞳孔半径内，此模型的人眼检测能够取得3%左右的精度提升，视线估计误差能够降低1度左右。实验结果验证了本文提出的级联联合回归模型的有效性，表明了级联联合回归在复杂驾驶场景下实现协同式人眼检测及视线估计的应用潜力。最后，本文研究了基于深度堆叠沙漏网络模型的协同式人眼检测及视线估计。为了保证精确度的同时降低模型参数量，提出一种新的回归模型——深度堆叠沙漏网络，根据模型子网络间任务的差异性，堆叠不同尺度的子模块组成沙漏网络进行人眼检测。同时根据眼球结构计算视线方向，从而实现人眼检测及视线估计。研究中采用了对抗网络生成的大量图像训练模型。在多种测试数据集上的实验结果显示，此方法人眼检测精度可以达到99.3%，视线估计误差降至9.5度，保证准确度的同时减少了模型参数量。综上所述，本文围绕复杂驾驶场景下人眼检测和视线估计中的关键问题，研究了眼睛区域定位，设计了线性级联联合回归、非线性深度堆叠沙漏网络模型实现协同式的人眼检测及视线估计。本文的研究内容一定程度上能提高人眼检测精度，降低视线估计误差，对实际驾驶场景下监测技术研究有重要意义。
语种	中文
页码	94
内容类型	学位论文
源URL	[http://ir.ia.ac.cn/handle/173211/23905]
专题	毕业生_硕士学位论文
推荐引用方式 GB/T 7714	曹琳. 复杂驾驶场景下协同式的人眼检测及视线估计方法研究[D]. 中国科学院自动化研究所. 中国科学院大学. 2019.