题名基于图像序列的三维重构技术研究
作者马永壮1,2
答辩日期2006-05-31
文献子类博士
授予单位中国科学院沈阳自动化研究所
授予地点沈阳
导师刘伟军
关键词图像匹配 计算机视觉 摄像机标定 三维重建
学位名称博士
其他题名Research on 3D Reconstruction Based on Image Sequences
学位专业模式识别与智能系统
英文摘要基于图像序列的三维重构技术是当今热门的研究课题,它可以被应用在许多领域,例如反求工程,机器人视觉,虚拟现实等。三维测量重构技术是反求工程中对物体的三维几何形状进行三维离散数字化处理的方法。目前已有多种三维测量重构技术并得到了广泛应用,但是这些方法都存在着各种各样的使用限制条件。近年来,随着相关领域技术的不断完善以及硬件成本的降低,由图像序列三维重构技术原理进行三维物体测量技术日益受到人们重视。它不需要昂贵的设备,复杂的操作,仅需要摄像机和计算机就可以实现对实物的反求重构,但算法复杂、计算量大。本文针对这些问题,根据立体视觉的基本理论,开发了面向反求工程和机器人视觉系统的测量与重构软件系统,并对一些经典算法进行了改进和提高,提出了自己的方法,同时在实际中得到了很好的应用。 本文首先分析了面向反求工程领域中数据获取的理论和方法,论述了目前现有方法的局限性,并详细地阐述了基于图像测量重构的优势以及基本原理:指出了依靠由图像进行测量和重构的可能性;给出了面向反求工程和机器人视觉的图像序列进行重构的理论框架。 摄像机标定是三维重构重要预备步骤,它的精度决定着后面重建和测量的总体精度。本文在前人工作的基础上,着重分析了当前比较经典的摄像机标定方法,并且对它们的标定精度和时间复杂度进行了分析和比较。在模拟数据和真实数据中,指出了非线性标定方法的精度要好于线性标定方法,然而在时间复杂度上线性标定时间要小于非线性标定时间,并将非线性Faugeras算法应用在实际软件应用中,得到很好的效果。 针对传统视觉基础矩阵计算中存在的噪音和误匹配问题,提出了基于射影空间下基础矩阵计算方法。因为三视几何比传统的对极几何具有更多的匹配约束.因此首先定义了三视几何中射影标准基下基础矩阵只含有五参数的特殊形式,以利用三视射影重建中空间点反投影图像误差最小为准则,消除了图像中误匹配的影响,然后基于RANSAC技术寻找出最优七个匹配点(噪音最小)来进行对极几何估算。大量仿真模拟试验和真实图像表明此方法能够高精度地估计出基础矩阵,并且能积极有效地克服图像噪音和误匹配问题。摄像机自标定是指不需要标定装置,仅仅通过图像对应点的关系就可以求出三维几何信息。本文依据本质矩阵的性质,定义了一个非线性优化函数,通过给非线性函数不同的初始值,分析此函数的收敛程度和标定的精度。并在此基础上提出了一种利用场景约束平行性和垂直性条件来进行摄像机自标定的方法。该算法提高了三维重构和自标定的精度和鲁棒性,并且采用随机采样算法,智能地避开了非线性自标定收敛的失败。这一算法无论是在模拟数据和真实数据中都能得到满意的结果。 摄像机自标定天生就是一个非线性问题,它经常需要一个比较接近真实值的初始值迭代求解。.针对这个问题,本文提出了一种基于双目主动视觉的线性自标定算法。本文首先分析当前自标定算法原理,所有的自标定算法都是依据绝对二次曲线和绝对二次曲面。本文从理论上推导出了绝对二次曲面包含了摄像机全部内参数和无穷远平面信息,并根据双目视觉之间的平移关系,扩展了无穷远平面信息对绝对二次曲面的线性约束,仅仅通过两幅图像就可以线性自标定和三维重建.大量仿真试验和真实图像说明本方法能够得到满意的结果,可以应用到实际视觉测量。图象校正是图像匹配的预备步骤。 传统的非标定图像校正都是依赖于基础矩阵的精度。而本方法根据图像校正基本准则,提出一种无需高精度基础矩阵的鲁棒性图像对校正算法,基础矩阵只是提供迭代优化的初始数值。与需要基础矩阵的方法相比较,结果表明本方法能有效地消除垂直视差,较好地处理射影畸变问题。该算法不再只依赖于基本矩阵,而是直接利用了原始匹配点的信息。这种基于点的方法有两个优点:一方面,由于噪声的干扰,基本矩阵往往估计得不够准确;另一方面,由于基本矩阵的评价准则与校正结果的评价准则不同,即使从好的基本矩阵出发,也未必能获得好的校正结果。稠密匹配是为了获得反映三维物体全貌的密集型“点云”。本文提出一种基于图像分割的稠密匹配算法。在匹配过程中深度不连续经常发生在被分割区域的边界上,这是因为场景中物体内部的深度变化一般较小,物体之间的深度变化一般较大所引起的,在每个分割区域中,以连续性和唯一性作为约束,以图像的稀疏匹配或者互相关匹配作为种子点进行扩散,直到匹配完整幅图像。在全局稠密匹配中同样将图像分割线索集成在基于图论最小切割的稠密匹配中,以数据项,平滑项和遮挡项作为全局优化函数,基于 扩展操作的近似算法用局部优化逐步逼近全局最优,通过缩短源到汇的路径长度,可在有限的内存中实现网络最小切割的快速计算。结合上述基础理论和实际技术,利用VC++开发了一套基于WINDOWS操作系统的立体视觉三维重建软件,包括像机标定模块,图像匹配模块,三维重建模块,通过已经标定好的摄像机拍摄两幅图像就能自动重构出物体的三维模型。试验证明该软件在机器人双目视觉、反求工程中都得到了很好的具体应用。
语种中文
产权排序1
公开日期2010-11-29
页码114页
分类号TP391.4
内容类型学位论文
源URL[http://210.72.131.170//handle/173321/121]  
专题沈阳自动化研究所_工业信息学研究室_先进制造技术研究室
作者单位1.中国科学院沈阳自动化研究所
2.中国科学院研究生院
推荐引用方式
GB/T 7714
马永壮. 基于图像序列的三维重构技术研究[D]. 沈阳. 中国科学院沈阳自动化研究所. 2006.
个性服务
查看访问统计
相关权益政策
暂无数据
收藏/分享
所有评论 (0)
暂无评论
 

除非特别说明,本系统中所有内容都受版权保护,并保留所有权利。


©版权所有 ©2017 CSpace - Powered by CSpace