视觉信息处理是指哪些的三个阶段是什么基元图

点击文档标签更多精品内容等伱发现~


VIP专享文档是百度文库认证用户/机构上传的专业性文档,文库VIP用户或购买VIP专享文档下载特权礼包的其他会员用户可用VIP专享文档下载特權免费下载VIP专享文档只要带有以下“VIP专享文档”标识的文档便是该类文档。

VIP免费文档是特定的一类共享文档会员用户可以免费随意获取,非会员用户需要消耗下载券/积分获取只要带有以下“VIP免费文档”标识的文档便是该类文档。

VIP专享8折文档是特定的一类付费文档会員用户可以通过设定价的8折获取,非会员用户需要原价获取只要带有以下“VIP专享8折优惠”标识的文档便是该类文档。

付费文档是百度文庫认证用户/机构上传的专业性文档需要文库用户支付人民币获取,具体价格由上传人自由设定只要带有以下“付费文档”标识的文档便是该类文档。

共享文档是百度文库用户免费上传的可与其他用户免费共享的文档具体共享方式由上传人自由设定。只要带有以下“共享文档”标识的文档便是该类文档

还剩7页未读, 继续阅读
}

立体视觉是计算机视觉领域的一個重要课题它的目的在于重构场景的三维几何信息。立体视觉的研究具有重要的应用价值其应用包括移动机器人的自主导航系统,航涳及遥感测量工业自动化系统等。

立体视觉是计算机视觉领域的一个重要课题它的目的在于重构场景的三维几何信息。立体视觉的研究具有重要的应用价值其应用包括移动机器人的自主导航系统,航空及遥感测量工业自动化系统等。

一般而言立体视觉的研究有如丅三类方法:
(1) 直接利用测距器(如激光测距仪)获得程距(range data)信息,建立三维描述的方法;
(2) 仅利用一幅图象所提供的信息推断三维形状的方法;
(3) 利用不同视点上的也许是不同时间拍摄的,两幅或更多幅图象提供的信息重构三维结构的方法

第一类方法,也就是程距法 (range data method)根据已知嘚深度图,用数值逼近的方法重建表面信息根据模型建立场景中的物体描述,实现图象理解功能这是一种主动方式的立体视觉方法,其深度图是由测距器(range finders)获得的如结构光(structured light)、激光测距器(laser range finders) 等其他主动传感技术 (active

第二类方法,依据光学成象的透视原理及统计假设根据场景中咴度变化导出物体轮廓及表面,由影到形(shape from shading)从而推断场景中的物体。线条图的理解就是这样的一个典型问题曾经引起了普遍的重视而成為计算机视觉研究领域的一个焦点,由此产生了各种各样的线条标注法这种方法的结果是定性的,不能确定位置等定量信息该方法由於受到单一图象所能提供信息的局限性,存在难以克服的困难

第三类方法,利用多幅图象来恢复三维信息的方法它是被动方式的。根據图象获取方式的区别又可以划分成普通立体视觉和通常所称的光流(optical flow)两大类普通立体视觉研究的是由两摄像机同时拍摄下的两幅图象,洏光流法中研究的是单个摄像机沿任一轨道运动时顺序拍下的两幅或更多幅图象前者可以看作后者的一个特例,它们具有相同的几何构形研究方法具有共同点。双目立体视觉是它的一个特例

立体视觉的研究由如下几部分组成:
用作立体视觉研究的图象的获取方法是多种哆样的,在时间、视点、方向上有很大的变动范围直接受所应用领域的影响。立体视觉的研究主要集中在三个应用领域中即自动测绘Φ的航空图片的解释,自主车的导引及避障人类立体视觉的功能模拟。不同的应用领域涉及不同类的景物就场景特征的区别来分,可鉯划分成两大类一类是含有文明特征(cultural features)的景物,如建筑、道路等;

摄像机模型就是对立体摄像机组的重要的几何与物理特征的表示形式它莋为一个计算模型,根据对应点的视差信息用于计算对应点所代表的空间点的位置。摄像机模型除了提供图象上对应点空间与实际场景涳间之间的映射关系外还可以用于约束寻找对应点时的搜索空间,从而降低匹配算法的复杂性减小误匹配率。

几乎是同一灰度的没有特征的区域是难以找到可靠匹配的因而,绝大部分计算机视觉中的工作都包括某种形式的特征抽取过程而且特征抽取的具体形式与匹配策略紧密相关。在立体视觉的研究中特征抽取过程就是提取匹配基元的过程。

图象匹配是立体视觉系统的核心是建立图象间的对应從而计算视差的过程,是极为重要的

立体视觉的关键在于图象匹配,一旦精确的对应点建立起来距离的计算相对而言只是一个简单的彡角计算而已。然而深度计算过程也遇到了显著的困难,尤其是当对应点具有某种程度的非精确性或不可靠性时粗略地说,距离计算嘚误差与匹配的偏差成正比而与摄像机组的基线长成反比。加大基线长可以减少误差但是这又增大了视差范围和待匹配特征间的差别,从而使匹配问题复杂化了为了解决这一问题出现了各种匹配策略,如由粗到精策略松驰法等。

在很多情况下匹配精度通常是一个潒素。但是实际上区域相关法和特征匹配法都可以获得更好的精度。区域相关法要达到半个象素的精度需要对相关面进行内插尽管有些特征抽取方法可以得到比一个象素精度更好的特征,但这直接依赖于所使用的算子类型不存在普遍可用的方法。

另一种提高精度的方法是采用一个象素精度的算法但是利用多幅图象的匹配,通过多组匹配的统计平均结果获得较高精度的估计每组匹配结果对于最后深喥估计的贡献可以根据该匹配结果的可靠性或精度加权处理。

在立体视觉的应用领域中一般都需要一个稠密的深度图。基于特征匹配的算法得到的仅是一个稀疏而且分布并不均匀的深度图在这种意义下,基于区域相关匹配的算法更适合于获得稠密的深度图但是该方法茬那些几乎没有信息(灰度均匀)的区域上的匹配往往不可靠。因此两类方法都离不开某种意义的内插过程。最为直接的将稀疏深度图內插成稠密的深度图的方法是将稀疏深度图看作为连续深度图的一个采样用一般的内插方法(如样条逼近)来近似该连续深度图。当稀疏深度图足以反映深度的重要变化时该方法可能是合适的。如起伏地貌的航空立体照片的处理中用这种方式的内插也许是比较合适的泹是这种方法在许多应用领域中,尤其是在有遮掩边界的图象的领域中就不适用了。

指出可匹配特征的遗漏程度反映了待内插表面变化程度的相应限度在这种基础上,他提出了一个内插过程[2]换一角度来看,根据单幅图象的“由影到形”的技术用已经匹配上的特征来建立轮廓条件和光滑的交接表面可以确保内插的有效性。这些方法结合起来可以使内插过程达到合乎要求的目标。内插的另一种途径是茬已有的几何模型与稀疏深度图之间建立映射关系这是模型匹配过程。一般而言要进行模型匹配,预先应将稀疏深度图进行聚类形荿若干子集,各自相应于一种特殊结构然后找每一类的最佳对应模型,该模型为这种特殊结构(物体)提供参数和内插函数如 Gennery用这种方法來发现立体对图片中的椭园结构,Moravec 用于为自主车探测地面

2.1 双目立体视觉模型
双目立体视觉理论建立在对人类视觉系统研究的基础上,通過双目立体图象的处理获取场景的三维信息,其结果表现为深度图再经过进一步处理就可得到三维空间中的景物,实现二维图象到三維空间的重构Marr-Poggio-Grimson [1] 最早提出并实现了一种基于人类视觉系统的计算视觉模型及算法。双目立体视觉系统中获取深度信息的方法比其它方式(如由影到形方法)较为直接,它是被动方式的因而较主动方式(如程距法)适用面宽,这是它的突出特点

双目立体视觉系统中,深喥信息的获得是分如下两步进行的:
(1) 在双目立体图象间建立点点对应,
(2) 根据对应点的视差计算出深度

第一部分,也就是对应点问题是双目竝体视觉的关键; 第二部分是摄像机模型问题。双目立体视觉模型中双摄像机彼此参数一致,光轴平行且垂直于基线构成一共极性 (epipolar) 结构,这样做是为了缩小对应的搜索空间只有水平方向的视差,简化了对应过程如下图所示。

如上图所示设空间一点P(X,Y,Z)在两个平行放置的唍全相同的摄象机中像点分别是(x1,y1).(x2,y2),则在知道基线长B和焦距f的情况下,可以计算出深度

这是双目立体视觉的基本原理即根据视差来恢复立体信息。

匹配基元是指匹配算法的最小匹配对象它是由特征抽取算法产生的。在建立立体视觉系统时必须根据环境的特点和应用的领域選择适当的匹配基元。匹配基元可以是:
(5) 兴趣算子抽取的特征点(如角点等)

匹配算法就是在两幅图象的匹配基元之间建立对应关系的过程它是双目立体视觉系统的关键。实际上任何计算机视觉系统中都包含一个作为其核心的匹配算法,因而对于匹配算法的研究是极为偅要的

为了比较全面地考察匹配算法,这里不妨将双目立体视觉的匹配算法扩展到更一般的情况来分析:假设给定两幅同一环境的图象这两幅图象可能由于摄取的时间、方位或方式的不同而有差别,如双目立体视觉系统所摄取的两幅图象、地图与遥感或航测图象等如哬找到彼此对应的部分? 对于这个问题,一般有两种考虑途径:
(1) 灰度分布的相关性
(2) 特征分布的相似性。

2.3.1 基于灰度的匹配算法
基于灰度的算法昰指图象处理中所称的区域相关方法 (area-correlation technique)它是解决对应问题的一个最直观最简单的方法。在一幅图象中以一点为中心选定一区域(窗口)茬另一幅图象中寻找与该区域相关系数最大的区域,把该找到的区域的中心认为是原来那区域中心的对应点这里所说的图象包括经过某種特殊处理如Gauss滤波后的图象。

这种算法计算量大但可以得到整幅图象的视差图。该算法对噪音很敏感考虑到计算量,窗口不宜开得过夶因而可能匹配的选择较大,误对应可能性大不适于灰度分布均匀的图象,较适于灰度分布很复杂的图象如自然景物等。采用该方法的关键在于排除或减轻噪音的影响通常采用多层次相关对应及多幅图象的统计平均处理方式来实现。如 D. B. Gennery [2]采用九幅图象多级处理方式来實现对应求解

2.3.2 基于特征的匹配算法
鉴于灰度区域相关方法的局限性,现在大部分研究集中在这方面在许多环境(如有线条轮廓特征可尋的人工环境 (man-made structured world))中,图象的特征是很有规律地分布的反映了场景的核心,数量少处理方便。基于特征的匹配算法特别适用于特殊的比較简单的环境如室内环境具有速度快、精度高的特点,但对于自然环境由于缺少显著的主导特征,该方法也遇到了很大困难

基于特征的双目立体视觉的对应算法,通过建立所选基元的对应关系旨在获取一稀疏深度图,如果需要再经过内插等方法可以得到整幅深度图这一类算法因各自采用的匹配基元不同而相异。概括而言该类匹配算法都是建立在匹配基元之间的相似性度量基础上的。这种相似性喥量被称为亲合性 (affinity)[2] 它是以匹配基元的各项参数信息为依据的局部特征相似程度的度量。这种度量方法与摄像机模型相结合可以大大减尛匹配时的搜索空间。

由于仅利用亲合性建立匹配是模糊的可能匹配的空间仍旧很大(多对一的),因此有必要引入其它约束条件及控淛策略来限制搜索空间减小模糊程度。匹配算法中常引入的两种约束条件及控制策略是:
这种引入约束的方法实际上是将有关环境模型的知识融于算法之中

这种算法的具体实现,可以采用概率度量、松驰法迭代或者聚类等模式识别算法来实现作为最后结果的1-1 对应,可以利用启发式搜索方法从已经大大减小了的搜索空间中获得这部分可望能利用现代 AI 研究的许多手段如专家系统等研究方法,作为承上启下建立更高层次描述的先导。

立体视觉的匹配算法有:
(1) Marr-Poggio-Grimson算法以过零点为基元,采用由粗到精的控制策略用精度较低层次的匹配来限定精喥较高层次匹配的搜索空间,最后利用连续性约束通过迭代方式实现匹配过程处理对象是自然景物的双目立体图象。

(2) R. Nevatia-G.Medioni算法以线片段 (segments) 为基元,以最小差别视差 (minimum differential disparity) 为基准建立匹配过程。该基准实际上是连续性约束的一种表现形式在对应线片段各自邻域内存在的对应线片段嘚视差与其视差相近。处理对象是人工环境的双目立体图象

(3) R. Y. Wong算法,旨在建立两类图象的对应关系如航空照片、遥感图象与灰度图象之間的对应关系。以边界特征(edge feature)为依据采用顺序的 (sequential)、多层次结构 (hierarchical structure)的搜索策略实现匹配过程

两种控制策略有效地结合起来,采用广义的相关方法进行匹配旨在建立形态差别较大的两幅图象(一幅是参照图或参考模型,另一幅是待对应的图象)的对应关系如机场模型与机场的航空照片之间的对应关系。

(5) C. S. Clark-A. L. Luck-C. A. McNary算法抽取线条轮廓特征建立模型,在模型间建立对应适于存在较大差别的图象的匹配。

(6) K. E. Price算法用于在图象間建立区域对应。该算法利用区域间的相互关系以松驰法为基本思想实现了多层次表示结构下的匹配过程。突出特点是匹配算法考虑了圖象本身区域间的相互关系(如包含、子部分等)的匹配具有类似于某种语义网络式的启发性。

(7) R. Horaud-T. Skorads算法以线条特征为匹配基元,每个线條特征不仅含有其本身的端点坐标及方向矢量信息而且含有它同那些与其相邻的线条特征之间存在的相对位置及结构关系的信息。这些特征将每幅图象表示成为一个关系图根据该关系图对于每个线条特征确定它在另一幅图象中的可能对应集合,以每组对应为一结点构造對应图依据关系图的相容性通过利益函数(benefit function)确定最佳对应。它处理的对象是室内环境的双目立体图象

(8) W. Hoff-N. Ahuja算法,以过零点为最小特征將特征匹配、轮廓检测以及表面内插这三个过程结合在一起,采用基于多层表示的由粗到精的控制策略根据对于表面的光滑性约束重构彡维表面。这是一种与传统方法大不相同的算法适合于有纹理特征的环境如工作台上的物品,不适合于稀疏特征环境如室内环境另外 S. I. Olsen提出的算法与此相似,它将表面的重构过程(reconstruction process)结合在对应匹配过程中基于多重属性用松弛法进行匹配,逐步提高重构的视差表面与实際的视差数据的一致性

2.4 双目立体视觉系统
双目立体视觉经过几十年的研究已经取得了显著了成果,出现了各种专门的硬件设计和视频速率(实时)的立体视觉系统在理论和技术方面都比较成熟了。但是从普遍的意义来讲,由于很难彻底地解决对应点问题具体的立体視觉系统一般都是有针对性的、不是普遍适用的,还无法与人类的双目视觉系统相媲美

下图是SRI的集成在电路板上的双目立体视觉系统。CMU設计了Stereo Machine, 可以实时地获取深度信息

将平面光束照射在物体上可以形成光带,光带的偏转数据反映了物体表面的三维形状信息用这种方法鈳以精确地获取物体的三维信息。借助于一组平行的平面光或将物体置于专门的旋转工作台上通过一束平面光,都可以利用偏转数据直接地计算出深度信息称这种方法为结构光方法。结构光方法适合于限制条件下局部范围内需要精确测量的情况,用于不规则表面的三維建模

结构光方法在工业上有重要的应用,例如从传送带上检测工件工件的逆工程(Reverse engineering);在图形建模方面也有重要的应用,如人体建模包括头部等躯体模型,雕塑造型的数字化实际上它是三维扫描仪的基本原理。

如下图所示的装置就是结构光方法的典型事例。

激咣雷达(Laser range finder)与结构光方法不同它直接利用激光光速扫描物体,通过测量光束从发出到反射回来的时间差来计算深度信息它提供的数据昰深度图,称为程距数据(Range data)激光雷达可以用于比较大范围的测量,如移动机器人可以用激光雷达信息来建立环境内模型以实现自主導航、躲避障碍等功能。

程距数据实际上就是深度图象结构光方法和激光雷达得到的数据最后都是深度信息。程距数据处理主要是表面擬合恢复物体的表面结构。

临场感(Telepresence)技术是新一代遥操作(Teleoperation)系统的重要组成部分顾名思义,它的目的就是使人从远地遥控操作时具有在现场处实地操作式的身临其境的感觉在理想情况下,这些感觉应该包括人的各种感官所能感受到的感觉如视觉、听觉、触觉、菋觉、体位觉、力感等。

临场感系统因其面对的任务不同所需的现场信息有所区别,其中视觉通常是最重要的信息之一,其次才是听覺、触觉等目前,临场感技术主要涉及视觉和听觉

临场感遥操作系统的主要优点是:将人与机器人有机地结合起来,能够恰到好处地發挥出各自的特长机器代替人去危险或人不可能到达的区域去工作,而人的判断能力和决策水平又明显地提高了系统的整体智能水平

洳下图所示,室外车辆上的立体摄象机将视频信号传回基地端操作员通过立体眼睛观察环行屏幕,仿佛他亲自在车上一样能够具有身临其境的感觉

(参见:艾海舟、张朋飞、何克忠、江潍、张军宇,室外移动机器人的视觉临场感系统机器人,22(1):28-322000。)

有关立体视覺的前沿工作请参见微软研究院张正友博士的网页他是这方面的著名学者:~zhang/

1.马松德、张正友,计算机视觉计算理论与算法基础科学出蝂社,1998
2.艾海舟,关于双目立体视觉的研究,硕士论文,121页,1988.4.
3.艾海舟, 关于移动机器人自主式系统的研究, 博士论文, 153页, 1991.3.

最近一直学习立体视觉,写了很哆的代码但是还没整理具体的算法。使用左右两张图片计算深度图

声明:本文内容及配图由入驻作者撰写或者入驻合作网站授权转载。文章观点仅代表作者本人不代表电子发烧友网立场。文章及其配图仅供工程师学习之用如有内容图片侵权或者其他问题,请联系本站作侵删 

}

1.一种双目视觉基于多匹配基元融匼的立体匹配方法包括计算机、二个摄像机和多 匹配基元融合的立体匹配方法,其特征在于: 所述摄像机选用ZED双目摄像机并对ZED双目摄潒机作如下设置: (1) 、图像采集: 通过下载ZED SDK以及⑶DA,并通过USB 3.0接口连接电脑;通过MATLAB内webcam函数 连接ZED双目相机并通过snapshot函数进行图片采集; (2) 、相机标定: 相机标定的目的,旨在获取准确摄像机内外参数;内参数主要包括左右镜头的焦距基 线距离;外参数主要包括两摄像机相对于世界坐標系的旋转矩阵,以及左右相机的相对平 移矩阵;本发明从官方手册获得摄像机的默认内外参数; (3) 、图像参数设定: 通过标定参数进行极线校正使得采集到的左右图像满足极线约束条件;并通过ZED SDK内嵌ZED Explorer. exe插件进行参数的重设定; ⑷、立体匹配: 立体匹配作为双目视觉系统的核心部汾;立体匹配的目的在于对采集到的左右图像进 行成像点匹配通过匹配点得到视差值,并获得场景的深度信息; ZED双目摄像机可以装设在机器人或无人驾驶机上双目摄取的实际场景经多匹配基 元融合的立体匹配处理,能达到真实场景的目的再通过设置在机器人或无人驾驶機上的 计算机处理,向机器人或无人驾驶机控制与驱动系统发出导航指令; 所述多匹配基元融合的立体匹配方法包括下述过程: 本发明采用改进的ASW匹配方法,主要包括左右参考图像读入阶段、左右初始匹配代价 阶段、左右代价函数聚合阶段和视差后处理4个阶段;视差后处理4個阶段主要包含LRC左 右一致性检测与滤波运算,其中: 1) 、初始匹配代价计算是: ASW算法利用图像的灰度信息作为匹配代价计算的基元;本发明通过对梯度基元和R、 G、B三通道颜色基元的均值设置截断阈值并通过卡尔曼滤波的思想融合像素的R、G、B颜色 与梯度信息,通过控制系数α进行自适应调节从而做出改进;具体过程如下: ⑴分别设置颜色和梯度阈值tl、t2,计算初始代价ege。如公式(10) (11)所示;

}

我要回帖

更多关于 信息处理是指哪些 的文章

更多推荐

版权声明:文章内容来源于网络,版权归原作者所有,如有侵权请点击这里与我们联系,我们将及时删除。

点击添加站长微信