题名 | 基于空时域的多目标检测与跟踪技术研究 |
作者 | 吴明军 |
学位类别 | 博士 |
答辩日期 | 2011-05 |
授予单位 | 中国科学院研究生院 |
授予地点 | 北京 |
导师 | 张启衡 ; 彭先蓉 |
关键词 | 多目标检测 多目标跟踪 空时域计算 静止像机 运动像机 |
学位专业 | 信号与信息处理 |
中文摘要 | 随着成像系统在日常生活、工业生产等场合的广泛应用,对视频内容进行自动分析与理解的需求也相应地变得非常迫切。作为计算机视觉领域的基础课题,多目标检测与跟踪无疑是分析与理解视频内容的重要环节。多目标检测的目的在于从视频序列中完整、准确地分离出所有感兴趣的区域,而多目标跟踪的目的则是要在整个视频序列中对所有的目标进行标记和定位。如何实现这两个目的对当前计算机视觉领域而言仍然极具挑战性。 由于对于视频图像序列来说,像素与像素之间在空间上是相互依存的,同样,帧与帧之间在时间上也不是相互独立的,为此,本文致力于挖掘和综合这些空域与时域信息、以服务于多目标检测与跟踪问题的解决。 为了在像机静止情形下区分背景动态纹理导致的图像运动与真实目标导致的图像运动,同时确保目标检测的完整,对码本编码的过程引入空间位置信息,实现近邻像素间码本模型的共享。这样不仅利用了动态背景的时间准周期行为,还兼顾了它们的空间准周期行为。在保证检测率的基础上,降低了虚警的产生。随后构建三层的随机场模型,将先前的检测结果、当前的前景/背景模型、及近邻像素的相互作用综合,进一步提高了检测性能。 同像机静止状态情形相比,像机运动状态在应用中更为普遍,因此导致检测问题也更为复杂。于是,本文按照成像场景的深度对像机运动下的检测问题进行分解,首先针对近似平面假设场景进行了方法研究,而后将其推广到强视差场景。 针对近似平面假设场景中的运动目标检测问题,本文提出的方法以联合多帧图像配准为基础,采用积累运动信息的方式构造不断更新的时域运动图像,而后通过对时域运动图像进行分割分离出最终的运动目标,使得检测到的目标区域完整、平滑,从而可以实现:不需要对目标相对像机运动速度的快慢作任何限制;并且,不需要对场景中存在目标与否、以及存在目标的数量作任何假设。 为了将运动目标检测问题推广到强视差场景中,研究了综合利用随机场来融合多尺度彩色对比度、积累得到的运动信息、以及像机运动下空间-彩色域非参数前景/背景建模得到的似然比信息,同时兼顾空间上的局部邻域相关性,并采用快速能量极小化技术获得随机场的最优配置的方法,实现前景目标与背景的有效分离。 在进行了多目标检测的基础上,本文还寻求解决如何在多目标跟踪过程中出现交叉或遮挡时持续地维持多目标标记和定位。首先,从二类分类的角度进行了解决,综合了图像分片在目标形状描述方面的性能、以及利用随机场来兼顾图像分片在相互作用区域的局部邻域相关性,通过二类分类不仅可以考虑到某个目标本身的信息,还可以引入其他与之相互作用的目标的信息,进而提高算法的遮挡处理能力。 为克服二类分类存在的不足——即当处于遮挡之中的目标有多少个,相应地则需要多少次二类分类过程方可给出处于该遮挡中的所有目标的标记和定位信息,本文进一步从多类分类的角度进行了解决,综合了空间-彩色混合高斯在目标形状描述方面的性能、以及利用随机场来兼顾在相互作用区域近邻像素的局部邻域相关性,从而,通过多类分类实现对遮挡过程中所有目标进行同时地标记和定位。 对于多目标检测和跟踪问题,本文围绕着如何充分挖掘和综合图像序列的空时域信息进行了探索,并取得了阶段性成果。这些成果为进一步的算法研究提供了理论基础,对多目标检测与跟踪的应用也具有一定的指导意义。 |
语种 | 中文 |
公开日期 | 2014-12-11 |
内容类型 | 学位论文 |
源URL | [http://ir.ioe.ac.cn/handle/181551/566] |
专题 | 光电技术研究所_光电技术研究所博硕士论文 |
推荐引用方式 GB/T 7714 | 吴明军. 基于空时域的多目标检测与跟踪技术研究[D]. 北京. 中国科学院研究生院. 2011. |
个性服务 |
查看访问统计 |
相关权益政策 |
暂无数据 |
收藏/分享 |
除非特别说明,本系统中所有内容都受版权保护,并保留所有权利。
修改评论