CORC  > 自动化研究所  > 中国科学院自动化研究所  > 毕业生  > 博士学位论文
题名人的跟踪与遮挡处理
作者周雪
学位类别工学博士
答辩日期2008-05-28
授予单位中国科学院研究生院
授予地点中国科学院自动化研究所
导师胡卫明
关键词视觉监控 跟踪 遮挡处理 基于主动轮廓的跟踪 带有遮挡推理的跟踪 基于主轴的多摄像机匹配 visual surveillance tracking occlusion handling active contour-based tracking people tracking with occlusion reasoning principal axis based multi-camera correspondence
其他题名People Tracking and Occlusion Handling
学位专业模式识别与智能系统
中文摘要人的跟踪在人运动的视觉分析与理解中占有重要的地位,属于视觉的中级处理部分。人的跟踪是通过对摄像机所拍摄 的视频图像序列进行处理,找出连续图像帧间的对应关系,实现对图像和图像序列中运动的人进行跟踪,给出其运动轨迹。 利用人的跟踪,可以方便地获得人的运动、姿态、行为参数, 为后续的高层的行为理解和识别奠定了基础。人的跟踪虽然是计算机视觉领域一个重要的研究方向和研究热点, 但是目前仍然有很多理论与技术 问题有待解决,特别是跟踪过程中遮挡问题的解决。 本文的工作以在视觉监控场景下鲁棒跟踪人体、解决遮挡问题为目标。在下面三个问题上进行了深入的探讨和分析: 移动摄像机下基于主动轮廓的跟踪和遮挡处理、 静止单摄像机下多目标的遮挡推理以及多摄像机下的人的跟踪。 大量的实验表明我们方法的有效性和鲁棒性。论文的主要工作和贡献如下: 我们通过引入一个马尔科夫随机场建模的惩罚因子来反映邻域内像素之间的关系,这样 得到的轮廓在一定程度上能减少背景干扰和噪音的影响。而现有的大多数基于区域的主动轮廓方法在计算区域似然 函数的时候通常假设区域内的像素是独立的。此外针对移动摄像机,提出了一个基于光流检测的轮廓初始化方法。 在上一个工作的基础上,将颜色和形状结合起来,提出了一个分层的基于level sets的跟踪框架用于处理刚体轮廓遮挡问题。 首先在第一层,初始轮廓先根据颜色信息进化,惩罚因子用来度量像素之间的关系;然后,基于 Mahalanobis距离的准则被用来判断是否要加入形状先验。如果需要形状先验,则第一层得到的轮廓会在已建立好的形状先验模型的 约束下继续进化;否则,第一层得到的结果就作为最终的跟踪结果。在第二层轮廓进化中,我们提出了一个权重形状距离因子(WSDT) 用来融合全局的形状信息和局部的颜色信息。形状先验模型建立在主成分分析(PCA)子空间并通过增量学习算法在线更新。 针对非刚体周期性运动,提出了一个基于聚类的动态形状先验模型的跟踪框架。该框架分为离线训练和在线跟踪两个阶段。 离线训练阶段,采用一个基于图理论的dominant set聚类方法学习出一个码本,其中每个码字代表一种特定的形状模式。然后构建一个码字转移矩阵用来刻画周期性运动物体轮廓 在时序上的关系。在线跟踪阶段,我们将形状先验知识和当前图像的观测值融合起来,采用最大化后验概率(MAP)估计预测当前帧的 形状模式。 基于此动态形状模型和颜色特征,即使在有部分遮挡或背景干扰的情况下,也能较准确跟踪上目标的轮廓。 我们提出了一个带有遮挡推理的多目标跟踪方法。该方法把遮挡关系作为隐状态融入整体的跟踪框架中, 将带有遮挡关系推理的多人跟踪问题看作是 最大化后验概率问题。遮挡关系的推导只由当前帧物体的状态、观测值和先验 模型确定,而与前一帧的遮挡关系无关。先验模型包括人体二维椭圆形状模型、空间-颜色多高斯(SMOG)模型和匀速运动模型。 采用粒子滤波算法实现了多人的跟踪与遮挡推理。 提出了基于主轴的多摄像机匹配算法。利用不同视角下图像平面关于地平面的单映关系作为多摄像机匹配的几何约束, 建立主轴匹配似然函数。相匹配的主轴对用来更新每个视角下人的脚点位置。即使人在每个视角下都被部分遮挡,我们的方法仍 能准确定位每个视角下该人的位置。
英文摘要People tracking plays an important role in visual analysis and understanding of human motion, it's the intermediate-level vision part. People tracking is to detect, localize and track moving people in video sequences captured by cameras. Through people tracking, we obtain the motion parameters, the poses and the trajectories of people, which are the foundation of the high-level activity understanding and recognition. Although people tracking has attracted increasing interest in recent years, many theoretical and technical problems remain open, especially the occlusion problem. The main contributions of this thesis include following issues: We introduce a penalty term encoding the Markov property to reflect the correlations between neighboring pixels. Results obtained using our method can decrease the influence of background disturbance and noises to some extent. Current region-based active contours methods usually assume the pixels in each region are independent when computing the region likelihood function. We propose a two-layer hierarchical level set-based tracking framework in which color and shape information are fused to deal with the occlusion problem of rigid objects. With respect to the periodic motion of non-rigid objects, a tracking framework with a clustering-based dynamical shape model is proposed. We propose a new approach for tracking multiple people with occlusion reasoning. Occlusion reasoning is integrated into the whole tracking framework and there transformed into a MAP problem. A principal axis-based multi-camera correspondence algorithm is proposed. Homographies between images in different viewpoints are recovered to provide the geometric constraint under which the principal axis correspondence likelihood is defined.
语种中文
其他标识符200518014628043
内容类型学位论文
源URL[http://ir.ia.ac.cn/handle/173211/6083]  
专题毕业生_博士学位论文
推荐引用方式
GB/T 7714
周雪. 人的跟踪与遮挡处理[D]. 中国科学院自动化研究所. 中国科学院研究生院. 2008.
个性服务
查看访问统计
相关权益政策
暂无数据
收藏/分享
所有评论 (0)
暂无评论
 

除非特别说明,本系统中所有内容都受版权保护,并保留所有权利。


©版权所有 ©2017 CSpace - Powered by CSpace