题名面向盲人视觉辅助眼镜的物体检测算法研究
作者黄佳明
答辩日期2019-05-23
文献子类硕士
授予单位中国科学院大学
授予地点中国科学院自动化研究所
导师常红星
关键词盲人眼镜 卷积神经网络 盲人室外场景数据集 物体检测 特征融合
学位名称工程硕士
学位专业计算机技术
英文摘要

近些年科技工作者已经开发了多种电子辅助装置来帮助盲人及视障人士外出导航,但是现有的盲人导航装置存在价格昂贵、体验和交互性差等问题。针对盲人出行问题,伴随着大数据时代的到来和硬件计算能力的极大提升,本文主要采用计算机视觉及深度学习技术,研究面向盲人室外出行场景的物体检测算法并设计盲人视觉辅助眼镜系统,实现盲人出行的智能化和人性化。本文的主要工作和创新性成果包括:

  1. 构建盲人室外场景数据集。本文沿盲道和交通路口采集相关图片数据集并进行标注,包括自行车、公交车、小汽车、摩托车、人、卡车和交通灯等七个常见物体类别,为后续的算法研究和盲人眼镜系统设计提供了数据基础。
  2. 基于多尺度特征融合的物体检测算法研究。以提高物体检测算法的鲁棒性为目标,需要提取更为鲁棒的目标物体特征,并且从整幅图像中精确地检测多尺度目标物体。本文基于回归的深度学习物体检测算法,将深浅层的多尺度特征层融合以提取高语义和高分辨率特征相结合的复杂特征进行物体检测,并通过实验验证了本算法对物体检测的有效性。
  3. 基于多层融合的小物体检测算法研究。为提高小目标物体的检测精度,需要从整幅图像中提取小物体更为丰富的几何细节信息。本文基于候选区域的深度学习物体检测算法设计多层融合的小物体检测模型,增加浅层卷积层用于物体检测,经过两次边框回归后精确地检测小物体,并在自建的数据集上验证了该算法的有效性。
  4. 设计盲人视觉辅助眼镜系统。本文设计一款智能化和人性化的导盲眼镜来辅助盲人室外出行,一方面能够实现GPS定位和路线连续导航,另一方面通过双目摄像头采集前方场景信息,以物体检测算法识别障碍物和交通灯状态,并结合双目视觉定位算法进行避障,通过语音形式播报给盲人。
语种中文
学科主题计算机科学技术
页码91
内容类型学位论文
源URL[http://ir.ia.ac.cn/handle/173211/23780]  
专题飞行器智能技术
推荐引用方式
GB/T 7714
黄佳明. 面向盲人视觉辅助眼镜的物体检测算法研究[D]. 中国科学院自动化研究所. 中国科学院大学. 2019.
个性服务
查看访问统计
相关权益政策
暂无数据
收藏/分享
所有评论 (0)
暂无评论
 

除非特别说明,本系统中所有内容都受版权保护,并保留所有权利。


©版权所有 ©2017 CSpace - Powered by CSpace