题名基于FPGA的实时瞳孔定位技术研究
作者吴孟杰
学位类别硕士
答辩日期2016-05-17
授予单位中国科学院大学
授予地点北京
导师宋宗玺
关键词瞳孔 FPGA 最小二乘法 RANSAC
中文摘要瞳孔的实时检测定位是眼球视线追踪领域的一个重要技术,通过检测眼睛的
瞳孔位置建立模型判断出视线方向和观察落点,达到以眼睛来操控和交流的目的,
在医疗、虚拟现实、UI 设计等多个领域大有用处。
准确地检测视线方向,需要高速捕捉眼睛的运动轨迹,直接导致了后端庞大
的计算量,另外眼睛的检测受到了外界光照环境、佩戴眼镜、睫毛、眉毛、头发
及其他个体不可预知性的面部特征等外界因素的干扰,严重地影响系统算法的准
确度。因此,瞳孔定位的实时性和准确性是视线追踪面临的一个重大挑战。
本文以帮助渐冻人以眼交流为背景,设计了高速CMOS 相机,在保持和一般
商用30 帧[8,9,41] 几乎相同的速率情况下,将分辨率从640×480 提升至1024×768,
更加准确的记录下眼睛的运动过程。利用FPGA 的优良的逻辑控制和高速接口特
性,实现快速读出、存储并传输高速图像数据的功能。
人眼图像采用预处理之后,采用算法拟合眼睛瞳孔的边缘以求得中心坐标等
信息。本文在最小二乘法(LSM)、最小二乘法和RANSAC 迭代法(LR)基础上做出
了改进,将迭代遍历所有点改进为迭代少量特征点,减少了迭代计算量,加快了
运行速度,通过实验数据比较三种算法的时效性和准确性得出最优的算法。实验
发现, LR 算法、 FPLR 均使得拟合精度提升,LR 需要经过至少6 次迭代,FPLR
仅需要3 次,可使得椭圆拟合准确率超过90%, FPLR 每秒处理27 帧图像,比
LR 算法提升了至少200%。
整体设计上,硬件设计方面有高速率、多电平、差分单端混合、多板层要求,
Verilog HDL 编程上状态复杂、时序严格,算法兼具准确性和鲁棒性的特点,使得
毕设整体具有较深的设计难度和很大的工作量,决定了本课题无论是至于科研还
是应用都有很强的实际意义。
语种中文
学科主题电子、电信技术 ; 计算机应用其他学科(含图像处理)
内容类型学位论文
源URL[http://ir.opt.ac.cn/handle/181661/27955]  
专题西安光学精密机械研究所_研究生部
作者单位中国科学院西安光学精密机械研究所
推荐引用方式
GB/T 7714
吴孟杰. 基于FPGA的实时瞳孔定位技术研究[D]. 北京. 中国科学院大学. 2016.
个性服务
查看访问统计
相关权益政策
暂无数据
收藏/分享
所有评论 (0)
暂无评论
 

除非特别说明,本系统中所有内容都受版权保护,并保留所有权利。


©版权所有 ©2017 CSpace - Powered by CSpace