题名 | 基于FPGA的实时瞳孔定位技术研究 |
作者 | 吴孟杰 |
学位类别 | 硕士 |
答辩日期 | 2016-05-17 |
授予单位 | 中国科学院大学 |
授予地点 | 北京 |
导师 | 宋宗玺 |
关键词 | 瞳孔 FPGA 最小二乘法 RANSAC |
中文摘要 | 瞳孔的实时检测定位是眼球视线追踪领域的一个重要技术,通过检测眼睛的 瞳孔位置建立模型判断出视线方向和观察落点,达到以眼睛来操控和交流的目的, 在医疗、虚拟现实、UI 设计等多个领域大有用处。 准确地检测视线方向,需要高速捕捉眼睛的运动轨迹,直接导致了后端庞大 的计算量,另外眼睛的检测受到了外界光照环境、佩戴眼镜、睫毛、眉毛、头发 及其他个体不可预知性的面部特征等外界因素的干扰,严重地影响系统算法的准 确度。因此,瞳孔定位的实时性和准确性是视线追踪面临的一个重大挑战。 本文以帮助渐冻人以眼交流为背景,设计了高速CMOS 相机,在保持和一般 商用30 帧[8,9,41] 几乎相同的速率情况下,将分辨率从640×480 提升至1024×768, 更加准确的记录下眼睛的运动过程。利用FPGA 的优良的逻辑控制和高速接口特 性,实现快速读出、存储并传输高速图像数据的功能。 人眼图像采用预处理之后,采用算法拟合眼睛瞳孔的边缘以求得中心坐标等 信息。本文在最小二乘法(LSM)、最小二乘法和RANSAC 迭代法(LR)基础上做出 了改进,将迭代遍历所有点改进为迭代少量特征点,减少了迭代计算量,加快了 运行速度,通过实验数据比较三种算法的时效性和准确性得出最优的算法。实验 发现, LR 算法、 FPLR 均使得拟合精度提升,LR 需要经过至少6 次迭代,FPLR 仅需要3 次,可使得椭圆拟合准确率超过90%, FPLR 每秒处理27 帧图像,比 LR 算法提升了至少200%。 整体设计上,硬件设计方面有高速率、多电平、差分单端混合、多板层要求, Verilog HDL 编程上状态复杂、时序严格,算法兼具准确性和鲁棒性的特点,使得 毕设整体具有较深的设计难度和很大的工作量,决定了本课题无论是至于科研还 是应用都有很强的实际意义。 |
语种 | 中文 |
学科主题 | 电子、电信技术 ; 计算机应用其他学科(含图像处理) |
内容类型 | 学位论文 |
源URL | [http://ir.opt.ac.cn/handle/181661/27955] |
专题 | 西安光学精密机械研究所_研究生部 |
作者单位 | 中国科学院西安光学精密机械研究所 |
推荐引用方式 GB/T 7714 | 吴孟杰. 基于FPGA的实时瞳孔定位技术研究[D]. 北京. 中国科学院大学. 2016. |
个性服务 |
查看访问统计 |
相关权益政策 |
暂无数据 |
收藏/分享 |
除非特别说明,本系统中所有内容都受版权保护,并保留所有权利。
修改评论