HI,欢迎来到好期刊网!

图像处理技术论文

时间:2023-03-14 14:49:21

导语:在图像处理技术论文的撰写旅程中,学习并吸收他人佳作的精髓是一条宝贵的路径,好期刊汇集了九篇优秀范文,愿这些内容能够启发您的创作灵感,引领您探索更多的创作可能。

图像处理技术论文

第1篇

简单来说,计算机图像处理技术就是将一些图像、视频、图片等进行数字转化,并且通过转化将其变成计算机技术所能识别的固定代码,从而便于计算机进行识别和美化,通过对图像的一些操作使图像呈现出我们想要的图像效果,计算机图像处理技术的处理速度是相对较快的,而且其存储空间也相对较大,所以,对于那些已经处理过的图像和视频可以直接保存,同时,随着计算机信息技术的发展,计算机图像处理技术也取得了一定的进展,计算机图像处理技术只需要将数字转化为红、黄、蓝三种原始色彩的数字图像就可以,然后计算机通过对这些图像进行分析和处理,从而实现图像的多样化操作,同时,计算机图像处理技术的提高也体现在图像清晰度和分辨率,以及图像传输率等技术的提升和发展。

2计算机图像处理技术在网页设计中的应用

在网页设计的过程中,图像的处理和美化是其中最重要的环节之一,在一些较为复杂的网页中,可能会包含一些动态的图像以及flash元素等,这些元素的存在无疑增加了网页的特色,同时,也会提高客户体验,为了保持这些元素的鲜明性就需要将计算机图像处理技术很好的应用到网页设计中,提高网页质量的同时,增加网页的特点。

2.1满足网页设计中对于图片格式的需求

满足网页设计中对图片格式的需求是网页设计过程中最基础的环节,在网页设计中,需要各种不同的元素来组成一个完整的、特色鲜明的网页,从而让浏览者瞬间获取自己所需要的信息和资源,同时,网页设计必须具有一定的便捷性,这样才能有效的增加用户体验,同时增强用户浏览体验的感受,由此可见,图像的处理是网页设计中最基础的内容,所以,计算机图像处理技术首先需要处理的就是网页设计中的图像问题,其中jpeg是最为常用的图片格式,而gif可以实现图像的动态效果,由于这两种的网络图像格式所需要的参数和规格是不尽相同的,所以在应用计算机图像处理技术时,应该满足其格式的不同需求。

2.2对网页设计中图像的大小进行控制

众所周知,计算机的长度和宽度是有限的,这在一定程度上就决定了网页设计的图像也应该是有一定的规格,同时,为了保障网页浏览的清晰度和流畅度,就需要对网页中的图像进行一些特定的处理来限制其图像的大小,由于图像的大小与其所展现的清晰度有直接关系,所以,需要借助计算机图像处理技术来进行处理,以此来缓解清晰度和图像大小之间的矛盾,在追求图片高清晰度的同时,提高网页加载的速度和质量,同时提高网页浏览的效果。计算机图像处理技术主要是一种针对jpeg图片进行处理来权衡加载速度和网页浏览效果的一种技术,从而提高网页设计的浏览效果和网页质量。

2.3对网页设计进行进一步的开发

只有综合运用计算机图像处理技术对网页设计进行进一步的开发和应用,才能从根本上提高网页设计效果,近年来,计算机图像处理技术主要是以软件为主,photoshop是目前最为常用的图片处理软件,但是,随着网页设计的不断普及和发展,出现了更多网页个体设计者,为了满足不同个体对网页设计的个性化需求,同时带动个体成为网页设计的主流,丰富网页的内容和色彩,就需要适当的降低计算机图像处理技术的技术水平,以此满足社会大众的需求,其中photoshop的图片处理功能相对强大,但是photoshop主要是针对专业的网页设计人员开发的一种技术处理软件,所以,对于那些非专业的网页设计者,这个软件具有一定的难度,这在一定程度上限制了网页设计的普及和发展,所以,为了满足更多网页开发者的设计体验,要不断开发出一些相对简单和实用的计算机图像处理技术,进而推动计算机图像处理技术的革新和技术升级。

3结语

第2篇

【关键词】机器视觉 Matlab 图像处理 尺寸测量

在工业生产中,测量是进行质量管理的手段,是贯彻质量标准的技术保证。机械零件的尺寸检测作为产品加工的一个关键环节,其检测结果不仅影响产品的质量,而且对后续零件的再加工和装配产生决定性的作用。目前,常规的零件尺寸测量手段主要采用游标卡尺、激光测量仪和轮廓仪等完成检测环节。以上零件尺寸测量方法要么受测量工具限制,其测量精度有限;要么检测仪器过于昂贵且操作复杂,同时其准确率往往受人为因素的影响。

鉴于当前机器视觉技术的快速发展以及其在工业检测方面的成功应用,论文构想利用摄像机替代人眼,让计算机替代人脑,从而研制出一套针对零件常规尺寸的自动化y量系统。

1 系统概述

在充分遵循系统的完整性、可靠性、经济性和实时性等原则的基础上,本文设计出了一套基于机器视觉的零件常规尺寸测量系统。该测量系统主要由图像摄取、图像处理、图像特征提取和分析、图像常规尺寸测量和结果输出几部分组成。其工作原理图如图1所示。

2 硬件设计

基于机器视觉的零件常规尺寸测量系统的硬件主要包括:照明装置、摄像机、计算机和透明工作台。各部件的主要功能是:照明装置主要为零件图像采集提供合适的光照环境;摄像机用来采集零件数字图像并传送到计算机,然后保存为相应图片格式;计算机通过系统软件实现对零件图像的预处理、边界提取、特征提取、相机标定和常规尺寸计算;透明工作台用来承载被测零件。

3 算法设计

图像处理算法对机器视觉测量系统会产生决定性的影响。为了能满足零件尺寸测量的要求,针对零件产品图像的特点,我们设计了一套合理的图像处理算法流程。其流程图如图2所示。

首先对获取的零件图像进行预处理,包括图像灰度化、图像去噪、图像分割和边界提取;然后提取零件的几何特征;最后通过对系统的标定,实现了零件图像常规尺寸的测量和结果显示。

3.1 图像预处理

3.1.1 图像灰度化

经过摄像机采集到的零件图像是24位真彩色RGB图像,该图像中的每个像素由R、G、B三个分量决定,而灰度图像的每个像素由一个值确定。为了减少后续操作过程中的计算量,需要对采集到的零件图像进行灰度化处理。

3.1.2 图像去噪

采集系统获取的待检零件图像由于受照明程度、环境温度、电源变化、电磁辐射和振动等随机因素的干扰,图像会包含大量的噪声,表现为图像模糊、失真和大量斑点等。为了消除和抑制噪声对零件图像后续处理的影响,必须对图像进行滤波处理。由于中值滤波既能消除噪声又能保持图像的细节,符合本系统检测的需求。

3.1.3 图像分割

在所采集到的零件图像中,我们只对零件区域本身感兴趣,对于图像中的其他要素则要尽量消除。图像分割就是指把图像分成各具特性的区域,并提取出感兴趣目标的技术和过程。经过大量的实验验证,本文采用迭代阈值分割法实现对零件图像的分割,达到了预期的处理效果。

3.1.4 边界提取

轮廓是对物体形状的有力描述,对图像分析和识别十分有用,而通过边界提取算法就可以得到物体的边界轮廓。目标图像边界提取的方法很多,主要包括链码表示法、标记图法以及多边形近似法等。论文采用8连通链码法对待测零件进行了边界提取,为后续零件尺寸的检测奠定了很好的基础。

3.2 图像分析

3.2.1 特征检测

要测量零件的尺寸,首先应该检测出零件所包含的直线和圆等基本的几何特征。目前常用的几何特征检测方法有Hough变换法、拟合法和模板匹配法等。本文采用最小二乘法实现了对直线和圆的拟合,其拟合具体过程如下:

(1)采用最小二乘法实现对直线的拟合。

(2)采用最小二乘法实现对圆和圆弧的拟合。

采用最小二乘法对圆和圆弧的拟合过程与直线的拟合求解过程类似。设所求拟合圆的方程为:。根据最小二乘法应满足的条件,可以求出拟合圆的三个参数:u、v和r。

这样,通过基于最小二乘法的直线和圆拟合方法,可以顺利检测到直线和圆弧几何特征,为后续零件尺寸的测量奠定了基础。

3.2.2 系统的标定

相机拍摄到的图像是以像素为单位的,要得到待检零件的实际尺寸,需要将像素尺寸转换为长度尺寸,这个过程称为系统的标定。本文使用0级精度量块,采用二次标定法实现了对系统的标定过程。被测零件的实际尺寸L与像素尺寸N之间应满足如下关系式:L=KN+b

式中,b为系统误差,K为标定系数;

在摄像机固定的情况下,求取参数K和b值的具体步骤如下:

(1)在被测位置放置一长度为L1的标准量块;

(2)对标准量块进行扫描、处理,得到对应的像素尺寸N1;

(3)在被测位置放置另一长度为L2的标准量块,重复步骤2,得到对应像素尺寸N2;

(4)求取参数值:

4 软件设计

本着稳定、可靠、合理、高效、简洁和易于操作的原则,我们采用面向对象的Matlab程序语言,实现了基于Matlab GUI的测量系统软件的设计。

本测量系统软件主要包括用户登录模块、文件管理模块、图像处理模块、参数设置模块、数据浏览模块和帮助模块等。其中,用户登录模块可以完成用户的注册、登陆、密码修改和账号管理;文件管理模块主要包括待测零件图像的打开、关闭和保存等功能;图像处理模块不仅包含文中所涉及到的算法,还增加了其他算法功能;参数设置模块可以实现对摄像机、零件和图像参数的设置;数据浏览模块可以完成对实时数据、历史数据和操作记录的查看;软件帮助模块主要用来说明软件的使用和系统的更新问题。

5 实验结果

为了验证测量系统的适应性、稳定性和可靠性,本文选用工作面距离为1.49mm的0级量块和直径为2.03mm的标准环规对系统进行了可靠性测试。实验的测量结果如表1所示。

采用概率与数理统计的方法对测量结果进行了处理。由处理结果可以看到,采用本测量系统,其测量精度可以达到微米级,可以满足在线实时测量的需要。

6 结论

作者设计了一套基于机器视觉的零件几何尺寸在线检测系统,克服当前人工检测的不足,提高了产品的检测精度。同时,完成了系统硬件、软件和图像处理算法的设计。实验结果表明:该测量系统的测量精度可以达到2um以下,满足零件尺寸非接触在线测量要求,具有很好的应用前景。

参考文献

[1]王保军.基于机器视觉的药瓶封装缺陷检测系统研究[D].沈阳:东北大学(硕士学位论文),2014.

[2]李岩,花国梁.精密测量技术[M].北京:中国计量出版社,2001.

[3]章毓晋.图像工程(上册)――图像处理和分析[M].北京:清华大学出版社,1999,5-120.

[4]张铮,王艳平,薛桂香.数字图像处理与机器视觉[M].北京:人民邮电出版社,2012(12):63-160.

作者简介

王保军(1988-),男,山西省忻州市人。硕士研究生学历。现为山西机电职业技术学院助理讲师。主要研究方向为基于机器视觉的零件在线检测。

第3篇

【关键词】椒盐噪声 双阈值 隶属函数

1 引言

噪声主要在数字图像的获取和传输过程中产生,一般是不可预测的随机信号,只能用概率统计的方法去识别。噪声对图像处理十分重要,其会影响图像处理的输入、采集、处理的各个环节以及输出结果的全过程。其中,椒盐噪声一般是由于传输误差或比特丢失造成的。椒盐噪声与其他的像素点有明显的区别,一般是邻域中的像素值的极值点。但是极值点并不一定是噪声点。椒盐噪声在图像上表现出黑白相间的亮暗点,会严重影响图像的质量。传统中值滤波算法(SMF)[1]能够减弱或消除傅里叶空间的高频分量,但是同时会影响低频分量。由于高频分量对应图像中的边沿灰度值具有较大较快变化的部分,所以SMF算法可将这些分量滤除,使图像平滑,破坏图像的边缘和细节。

文献[2]提出了模糊开关中值滤波算法(FSM),FSM算法处理效果比SMF算法要好一点。文献[3]提出了自适应模糊开关中值滤波(NAFSM)算法。文献[4]提出了EDPA算法。文献[5]和文献[6]提出基于神经网络的模糊中值滤波算法,对于受密度噪声污染的图像取得了不错的效果,但是计算量很大。文献[7]、文献[8]、文献[9]、文献[10]提出了一种自适应模糊中值滤波算法(AFM)。AFM算法对傅里叶空间的低频分量具有较好的滤除效果,但对高频分量的处理效果不是很好,主要是没有考虑椒盐噪声对图像的污染程度。所以本文在AFM的基础上提出了一种双阈值模糊中值滤波算法,该算法能很好地保护图像的细节,具有高效地处理椒盐噪声的能力。

2 算法的基本思想和实现

2.1 建立模糊系统

利用模糊系统(如图1所示),计算输入参数的模糊系数权值。因为处理的是椒盐噪声,所以只需输入滤波窗口中原值与中值的差,最后通过去模函数去模糊化,滤波输出。

图1 模糊滤波系统设计

滤波窗口S由w×w(w默认值为3,一般为奇数)的方阵组成。对S里的像素点值进行快排序,可得滤波窗口中像素的最小值为Smin,最大值为Smax,中值为Smed,均值为Smean。x(i,j)表示噪声图像在(i,j)的灰度值。模糊系统首先是计算参数S1(i,j)=x(i,j)-Smed。在图像处理的时候一般对像素的污染程度进行阈值的设置。这里假设最小阈值为Tmin,最大阈值为Tmax,同时设置参数S2=|x(i,j)-Smean|。当S2Tmax时,认为像素点严重污染,这时就用最近邻域已处理的像素点求均值代替。

设当前像素的灰度值为x(i,j),滤波后的像素的灰度值为y(i,j),模糊滤波系数为P。则模糊隶属函数为:

(1)

如果S2

y(i,j)=S(i,j) (2)

如果Tmin≤S2≤Tmax时,则:

y(i,j)=P×S(i,j)+(1-P)×Smed (3)

如果S2>Tmax时,则:

, i=0,j=0 (4)

,i>0,j=0 (5)

,i=0,j>0 (6)

i>0,j>0 (7)

2.2 算法实现

定义S(i,j)是以点(i,j)为中心,大小为w×w的方形窗口,可表示为S(i,j)={(k,l)||k-i|

具体方法如下:

设最大窗口为wmax×wmax,输出图像为y(i,j)。自适应双阈值模糊中值滤波算法的基本思想是通过判断窗口中心点是否为噪声来调节窗口的大小,以克服中值滤波对细节的破坏。

具体算法如下:

初始化窗口大小,令w=3。

计算窗口S(i,j)中像素的最小值Smin,最大值Smax,中值Smed及均值Smean。

如果Smin

如果w≤wmax跳到第2步,否则说明是噪声点,用邻域已处理点灰度值均值代取y(i,j)。

如果Smin

2.3 实验实现与分析

在win7系统和vs2010+opencv环境下,经过大量的仿真实验,最终得到Tmin=5,Tmax=13可以达到很好的去噪效果。实验分别对加入30%、80%的椒盐噪声的Lena.jpg进行处理。具体如图2、图3、图4所示:

图2 无噪声的原图

观察图3(a~e)到图4(a~e)可以发现,噪声轻度污染时各算法去噪能力没有明显差别;当噪声严重污染时SMF基本不能保护图像的细节,AFM、FSM能够适当地保护图像的细节,但是噪声点还是很多,论文算法能够很好地保护图像细节并去除噪声。

采用峰值信噪比(PSNR)归一化均方误差(NMSE)度量处理图像效果的好坏,定义如下:

(8)

(9)

式中y(i,j)表示去噪后的图像各像素点的灰度值,I(i,j)表示原始无噪图像各像素点的灰度值。M、N分别表示图像的高和宽。表1为几种算法的NMSE比较,表2为几种算法的PSNR的比较。

各种算法的NMSE如图5所示,各种算法的PSNR如图6所示。

从表1、表2、图5和图6可以看出论文算法去噪和其他算法相比优势非常明显。在加入小于40%的噪声时各算法的去噪效果差别不是很大。随着噪声的加大,其他算法处理能力明显下降,但是论文算法却达到一种趋衡的状态。

表1 几种算法的NMSE比较

噪声密度/

% 不同算法处理的NMSE

SMF AFM EDPA 论文算法

10 0.0022 0.0006 0.0012 0.0006

20 0.0048 0.0014 0.0021 0.0011

30 0.0171 0.0022 0.0029 0.0021

40 0.0457 0.0042 0.0066 0.0041

50 0.1096 0.0097 0.0149 0.0042

60 0.2156 0.0267 0.0271 0.0043

70 0.3673 0.0712 0.0734 0.0044

80 0.5661 0.1791 0.1578 0.0047

90 0.7968 0.4175 0.3785 0.0051

表2 几种算法的PSNR的比较

噪声密度/

% 不同算法的PSNR

SMF AFM EDPA 论文算法

10 32.2789 37.4440 36.7873 37.4440

20 28.8538 34.3215 33.2178 35.2321

30 23.3064 32.2061 30.1963 32.2624

40 19.0506 29.4123 27.2338 29.4182

50 15.2454 25.7989 23.7133 29.4086

60 12.3090 21.3828 20.7634 29.3226

70 9.99450 17.1203 17.2960 29.1659

80 8.11600 13.1141 13.4691 28.9376

90 6.63180 9.43800 10.2843 28.5508

图5 各种算法的NMSE

图6 各种算法的PSNR

3 结束语

本文在AFM算法的基础上提出了一种自适应双阈值模糊中值滤波算法。和其他去噪算法相比,论文算法具有极强的去噪性,同时很好地保护了图像的细节,并且算法具有稳定性,是去除椒盐噪声的好算法。

参考文献:

[1] Pitas I, Venetsanopoulos A N. Order statistics in digital image processing[J]. Proceeding of the IEEE, 1992,80(12): 1893-1921.

[2] H Ibrahim, K K V Toh, M N Mahyuddin. Salt-and-pepper noise detection and reduction using fuzzy switching median filter[J]. IEEE Transaction on Consumer Electronics, 2008,54(4): 1956-1961.

[3] K K V Toh, N A M Isa. Noise Adaptive Fuzzy Switching Median Filter for Salt-and-Pepper Noise Reduction[J]. IEEE Signal Processing Letters, 2010,17(3): 281-284.

[4] Nibong Tebal, Penang. Fuzzy Multipass Filter for Impulse Noise Removal in Digital Images[C]. Signals and Information Technology, 2013.

[5] M E Yuksel. A hybrid neuro-fuzzy filter for edge preserving restoration of images corrupted by impulse noise[J]. IEEE Transactions on Image Processing, 2006,15(4): 928-936.

[6] S Schulte, M Nachtegael, V D Witte, et al. A fuzzy impulse noise detection and reduction method[J]. IEEE Transactions on Image Processing, 2006,15(5): 1153-1162.

[7] T Palabas, A Gangal. Salt and pepper noise reduction in images using adaptive fuzzy filter[C]. SIU, 2012: 1-4.

[8] T Palabas, A Gangal. Adaptive fuzzy filter combined with median filter for reducing intensive salt and pepper noise in gray level images[C]. Innovations in Intelligent Systems and Applications, 2012: 1-4.

第4篇

关键词: MATLAB; 预处理; Hough变换; 降维; 形态学

中图分类号:TP391.41 文献标志码:A 文章编号:1006-8228(2016)11-17-04

Research on the image recognition of target sheet with MATLAB

Wang Weiyang, Ding Jiayue, Wang Penghong, Lu Zhengyong

(School of Imformation & Electronic Engineering, Zhejiang Gongshang University, Hangzhou, Zhejiang 310018, China)

Abstract: According to the shooting competition when a real-time and accurate detection of the shooting results is required, a research on image recognition of target sheet with MATLAB is presented in this paper. An image processing algorithm based on MATLAB is used in order to analyse the ring number of impact point on the target sheet captured by digital camera. Grayscale conversion, median filtering, and binariztion of the target sheet image are used in the image pretreatment. Sobel operator is used to extract image edge, so the amount of computation is dramatically reduced. And the bullet hole is recognized and located by using improved Hough transform, image subtraction method and morphological algorithm. The experimental results show that the image processing algorithm has fast speed and good accuracy.

Key words: MATLAB; pretreatment; Hough transform; mension reduction; morphology

0 引言

随着科技的发展,射击比赛时采用自动报靶系统,将会越来越普遍。这种方式不仅能减少人力物力支出、提高报靶效率,还能减小由于人为带来的不确定因素。目前已有不少单位研究出多种自动报靶系统[1-4]。基于机器视觉的自动报靶系统,应用环境要求特殊,还未得到普及[1-4]。本文基于MATLAB函数工具箱实现靶纸弹孔检测的数字化方法,在射击时对靶纸图像进行采集,通过基于MATLAB的图像处理技术对靶纸图像进行处理分析,并模拟图像进行成绩输出。

1 靶纸图像采集读取

靶纸图像采集可以有多种方式,本实验采用最高像素值为300万的数码相机拍摄,图像采集简便,便于推广应用。MATLAB中提供的imread()函数用于实现图像的读取操作,可读取JPG、TIF、GIF、HDF、XWD和CUR等多种图像格式。调用该函数后将得到一个存储图像数据的矩阵,后期对图像的各种处理正是基于该数据矩阵来完成。

2 靶纸图像预处理[1]

2.1 图像灰度化

数码相机拍摄的图像为彩色图像,图像中每个像素都包含有R(红色)、G(绿色)、B(蓝色)三种基色分量信息,每种基色分量均需要占用八位来表示基色强度,数据量较大。为减轻计算机工作量,去除掉部分无用信息,将图像进行灰度化处理,减少后续处理分析耗时。

在MATLAB中采用rgb2gray()函数对图像进行灰度化处理,该函数中三基色的权重系数取值为(0.299,0.587,0.114)[5]。

2.2 图像增强

对靶纸图像增强是为了突出图像中的有用信息,同时对噪声等无用信息进行一定的消除,类似信号处理中的滤波器。图像噪声常常表现为孤立像素点,如果不去除噪声,会对边缘检测、图像变换以及后续的弹孔定位带来影响。MATLAB中提供了平滑滤波器、中值滤波器以及锐化滤波器这三种图像增强滤波器[6]。平滑滤波器本质上类似低通滤波器,只对信号的低频部分有很好地选通性。靶纸图像中对属于高频部分的圆环边缘提取十分重要,采用平滑滤波器将对其造成破坏。锐化滤波器有时会导致输出图像灰度值出现负值,还需要进行相应灰度转换,增加处理工作量。本文采用中值滤波器对靶纸图像进行滤波处理,能有效去除类似斑点噪声及椒盐噪声的孤立像素点,同时较好地保留了图像的边缘信息[2]。这是一种非线性的去噪方法,其基本原理是在图像中一个像素周围确定一个邻域,以该邻域中各像素点灰度值的中值来代换该像素点自身的灰度值[4]。

MATLAB中提供medfilt2()函数用于对图像信息进行中值滤波,二维滤波窗口可以为方形、圆形、菱形等,由图像像素点构成,可在函数中设置窗口形状,默认为像素点的方形窗口[5]。

2.3 靶纸图像二值化

由于对靶纸图像的处理主要是对圆环和弹孔的识别提取,对于图像灰度值并没有特定的要求,所以进一步对图像二值化以去除无用信息。所选取的阈值需要能够有效保留图像特征,保证后续处理的可靠性。对灰度化后的靶纸图像绘制灰度直方图,如图1所示。

从直方图看出灰度值集中在Y220范围内,其中Y220对应白色背景以及白色圆环部分,所以阈值TG取值应在30/255

3 基于Hough变换的靶心定位

3.1 Hough变换圆检测原理[2,7]

Hough变换将二维图像平面转换为三维参数空间,采用类似“投票”模式的判断方法。三个参数值分别为圆心的行坐标a,圆心列坐标b,以及半径r。对于图像平面中的任何一个像素点(x,y)都要在三维参数空间内进行遍历运算,若运算结果满足关系式,则对应三维空间中的参数点票数加一。完成运算后,三维空间中“票数”最多(或满足一定数量)的参数点,其参数即为检测到的圆所对应圆心坐标以及半径值。Hough变换检测圆三个参数间的一般关系如下式:

3.2 用于靶纸圆环提取的Hough变换降维算法

从Hough变换原理可知,其运算过程中将会有大量的时空消耗,减少运算维度和参与运算的像素点数可以提高Hough变换效率。前期已对靶纸图像进行预处理得到图像的二值图,减少了参与Hough变换的像素点数。接着,采用Sobel算子对靶纸圆环进行边缘提取。图像边缘是图像局部特征不连续的表现,出现在两个不同图像区域的交界,常常是灰度突变的结果,在灰度突变处进行微分运算将产生高值[8]。MATLAB中通过调用edge()函数进行边缘提取,函数计算结果为和输入图像一样大小的二值图。边缘提取对图像的特征信息进行提取,进一步减少Hough变换算法的工作量,减少运算时间。

由于靶纸圆环均为同心圆环,只存在一个位置固定的圆心。经边缘提取后的图像是由像素点组成的多个同心圆环,圆环特征较为明显,考虑降低Hough变换的计算维度来提高计算速度[9],先进行靶纸圆心的提取,将圆心横纵坐标分别提取。首先是横坐标的提取,以平行于X轴的扫描线,自图像顶部向下纵向扫描。此时靶纸上圆环边缘点值为“1”,背景为“0”,因此每向下扫描一行,记录该行i中间距最大的两个“1”值像素点的横坐标分别为、,直至扫描完图像。接着,以平行于Y轴的扫描线,自图像左边向右横向扫描,记录像素点纵坐标分别为ali、a2i,直至扫描完图像。若某行只存在一个“1”值点,则跳过该行。距离最远的两“1”值点为最外圈圆环上的点,坐标中值(ami,bmi)即为对应圆心坐标,计算公式如下:

由于边缘提取后的圆环边缘不完全连续,且可能存在弹孔边缘信息以及噪声点,若以文献[10]中尽量多弦交点的简单统计平均来计算坐标,将引入上述影响因素,导致圆心定位出现误差。因此,采用类似Hough变换证据积累的判断方法,对每行/列扫描得出的中值坐标采取投票的积累方式,出现相同的中值点坐标时则对该坐标对应“票数”Na[ami]加1,当遍历完整幅图像时,找出“票数”最多的中值点坐标ammax。此处,可设置一个阈值Ta,考虑到图像像素点的离散化以及边缘提取带来的影响,将中值坐标满足

内的对应点ami求和,接着求取平均值,此平均值记为圆心坐标a。同理得b。通过这种方法可以有效减少非最外圈圆环上弦交点即错误点或者噪声点的干扰的影响。MATLAB中调用sum()函数用于求和,调用max()函数用于求取最大值。坐标关系式如下:

上述算法的部分MATLAB代码如下:

%BW为边缘提取后靶纸图

[rows,cols]=find(BW); %搜索1值像素点

mount=size(rows); number=mount(1);

i=1; j=1;

while(i

xjd(j,1)=rows(a);

while(i

if(cols(i)==cols(i+1))

xjd(j,2)=rows(i+1);i=i+1;

else

i=i+1; j=j+1; break;

end

end

end

number=length(xjd); Na=zeros(1,number);

for n=1:number%for循环计算中值及票数

zz(n)=round((xjd(n,1)+xjd(n,2))/2);

Na(zz(n))=Na(zz(n))+1;

end

[amax,id]=max(Na); %找出票数最多中值点

a=(Na(id)*id+Na(id-Ta)*(id- Ta)+Na(id+Ta)*(id+Ta))/

sum(Na(id-Ta:id+Ta))%基于阈值Ta计算均值得坐标a

根据机器视觉中的ROI(Region Of Interest)理论,恰当选取ROI能有效减少图像运算的计算量[11]。根据先验知识图像采集时圆心处于图像中部区域,将待验证像素点所处范围设定为图像中部的矩形区域,该矩形区域边长设为图像边长的1/4,由此进一步减少参与运算的像素点。本算法将圆的参数方程写为极坐标形式:

已知圆心坐标,根据先验知识设定r的可能取值范围,遍历计算感兴趣区域中的边缘点,采用上述Hough变换证据积累的方法得到r[9],且设定一个阈值Tr,减少离散数据带来的误差。阈值的设定使得对于一些存在干扰的靶纸图像也能有效地进行圆环检测,例如靶纸存在一定形变或者是子弹击中内圆环带来的干扰,提高了算法的鲁棒性。

4 基于图像差影法的弹孔定位[12]

4.1 图像差影算法[2,4]

本文在弹孔定位的分析上,将弹孔视为一个运动目标,每次射击后弹着点都不同,近似为目标的运动过程。运动目标的检测算法有帧间差分法、背景差分法以及基于光流场的检测方法,图像差影法是利用当前图像与初始图像进行减运算来提取目标的一种检测方法[13]。首先,采集射击前的靶纸图像以及本次射击后的靶纸图像,将两幅图像视为视频中的前后两帧图像,接着采用帧间差分法获得弹孔信息,并将弹孔图像二值化处理。

4.2 形态学滤波处理[3]

提取的弹孔图像可能会包含噪声,将会导致弹孔定位出现误差,对该图像进行先腐蚀后膨胀处理的开运算[5]。在MATLAB中调用imerode()函数对图像进行腐蚀操作,去除图像中小而无意义的噪声像素点;接着调用imdilate()函数对图像进行膨胀操作,使弹孔区域恢复至原始大小,即消除由于腐蚀对弹孔面积带来的影响。两个函数均采用strel()函数定义一个结构元素,其在形态学中的作用好比滤波器中的滤波窗口,该函数支持创建线形、矩形、方形、球形和自定义类型等的结构元素。

实现弹孔提取及定位的部分MATLAB代码如下:

b=imread('current.jpg'); %靶纸读取

B=I-b; %射击前后的靶纸图像差影

B=im2bw(B,T); %基于阈值T进行二值化

subplot(221),imshow(B)

se=strel('square',2); %定义方形结构元素

imeBW=imerode(B,se); %图像腐蚀

subplot(222),imshow(imeBW)

imdBW=imdilate(imeBW,se); %图像膨胀

subplot(223),imshow(imdBW)

[row,col]=find(imdBW==1); %搜索弹孔

x=min(col); w=max(col)-x;

y=min(row); h=max(row)-y;

subplot(224),imshow(imdBW)

hold on; %图像保持

rectangle('Position',[x,y,w,h],'LineWidth',1,'EdgeColor',

'w'); %框弹孔区域

5 实验结果

仿真实验在2.3GHz,RAM为4GB的计算机上进行,采用MATLAB8.2语言编写代码。本次实验采用靶纸满环11环,且不同环数圆环半径差相同。实验结果如图2、图3和图4所示。

求得弹着点环数及误差。其中(a,b)为环心坐标,(xd,yd)为弹孔坐标,r为中心圆环半径,Hj为环数计算值,Sj为人工计算值(采用尺规法测量),ρ为环数相对误差。计算结果若为负数,则判为脱靶。靶纸测试结果如表1所示。

6 总结

基于MATLAB函数工具箱的图像处理,函数调用方便,程序设计高效。首先通过图像预处理去除无用信息,接着将Hough变换算法降维进行内圆环的定位,最后搜索定位弹孔,求出弹着点坐标,方案适用于圆环完整的靶纸识别。计算出的射击环数相比人工计算误差在0.1环以内,且计算速度较快。进一步,可考虑靶纸形变带来的影响或将方案转换为硬件系统以提高实时处理性能,可以应用于射击比赛中的自动报靶系统,免去人工报靶可能带来的不确定性因素,提高比赛的公正度和效率。

参考文献(References):

[1] 周晓伟.基于图像处理的自动报靶系统研究[D].中北大学硕

士学位论文,2011.

[2] 陈海萍.基于机器视觉技术的模拟射击训练系统研究与设计[D].

厦门大学硕士学位论文,2012.

[3] 罗真.基于图像处理的自动报靶系统设计[D].中南大学硕士

学位论文,2014.

[4] 谢殿强.基于ARM-Linux机器视觉的军用自动报靶系统的

研究[D].山东大学硕士学位论文,2009.

[5] 周品.MATLAB图像处理与图形用户界面设计[M].清华大学

出版社,2013.

[6] 叶雯.基于MATLAB的图像去噪研究[J].计算机时代,

2015.6:10-12

[7] 陈小艳,王强,李柏林.改进的Hough变换检测圆方法[J].计算

机系统应用,2015.8:197-201

[8] 蒋先刚.数字图像模式识别工程软件设计[M].中国水利水电

出版社,2008.

[9] 赵京东.用两步Hough变换检测圆[J].计算机应用,2008.7:

1761-1763

[10] 孙蓉蓉.图像处理技术在自动报靶系统中的应用研究[D].南

京理工大学硕士学位论文,2006.

[11] 孙国栋,赵大兴.机器视觉检测理论与算法[M].科学出版社,

2015.

[12] 崔亚琳.基于计算机视觉的射箭精确自动报靶系统研究[J].

火控雷达技术,2015.12:27-30

第5篇

关键词:数字图像处理 教学模式 教学改革

中图分类号:G642

文献标识码:A

文章编号:1004-4914(2013)05-216-02

一、引言

随着电子和信息技术的迅速发展,数字图像处理已成为当今信息处理技术中发展很快且应用面很广的新兴学科之一。“数字图像处理”课程也成为了高校本科计算机与信息类专业的一门专业核心课程。但由于数字图像处理学科所涉及的知识面广,理论复杂,对数学基础的要求高,实践环节动手能力要求强,其课程内容也在不断更新丰富。在以往传统教学过程中呈现出了以下弊端:(1)教材中大量理论和算法推导给学生的学习带来困难;(2)单一的单机版多媒体教学,无法满足学生对新知识、新技术、新应用的了解和深入学习;(3)没有完善系统的实验指导书,促使学生学习的积极性下降,导致实验效果不佳;(4)没有实际项目作为应用锻炼,造成理论与实践脱钩,无法激发学生的学习动力和兴趣等。

针对数字图像处理教学过程中出现的上述问题,国内很多教学专家和学者,结合自己的实际教学过程,各抒己见,陆续提出了很多宝贵的改革建议和方案,取得了相应的教学改革成果。如山东工商学院的魏广芬和王永强等于2009年针对“数字图像处理”课程和学生特点,介绍了教学过程中实施的一些改革措施,包括采用现代化教学手段,“设问-思考-引导-尝试-总结”的教学模式和学生分组的学习方式,加强实验和课程设计教学环节以及完善评分机制等方面。并对教学过程中发现的相关问题进行探讨。西北民族大学的李向群和王书文于2010年从教学内容建设、教学手段改革、实验环境建立、考核方式改革等方面入手进行了深入细致的探讨,并将这些方法应用到实际教学过程中,收到了较好的效果。中国传媒大学的吕朝辉也于2010年根据数字图像处理课程的特点,探讨了本门课程的教学改革和实践,经过五年来的教学实施,取得了良好的教学效果。南通大学的赵敏于2011年,针对该课程的特点,论述了在教学中引入案例教学法的可行性和具体实施方案。

通过对上述数字教学改革的学习和研究,结合我校“大德育,大工程,大实践”的办学理念和信息与计算科学专业“3+1”教育模式(本专业“3+1”教育模式是指3年在学校完成理论课学习,1年在软件实习公司等完成工程实训、生产实习、毕业实习和毕业设计等实践环节,以培养应用型人才为培养目标)及本科生的特点。对本专业数字图像处理课程的教学进行了改革研究和实践。建立了一个以学生为主体,以现代网络多媒体教学为平台,以大学生科研立项为载体,以大学生就业或考研深造为目标的一套较为完善的数字图像处理课程教学体系结构。

二、课程改革内容

结合传统教学中存在的问题,和现代网络多媒体教学建设的需要。本课题研究内容主要将通过教学内容、教学方法、教学手段和考核机制来探索和实施。

1.优化教学内容。数字图像处理课程的基本内容包括图像处理的基础知识、图像增强、图像变换、图像分割、图像复原、图像特征提取与选取以及图像压缩编码等知识。但随着信息化时代知识的加快更新、技术快速革新,数字图像处理课程已成为模式识别和计算机视觉等新学科的基础,并根据学生就业需求的主线要求。通过对教学内容的深入研究,在本专业新版教学大纲中,对授课内容中要求以基础理论知识为基础,把相关的科研项目和实际项目渗透到授课中。例如在介绍图像处理的基础知识的时候,我们可以结合案例驱动来讲述图像处理的过程;将车牌识别、人脸识别、笔记识别等实际项目穿插到图像增强、图像分割、频域处理以及特征提取与选取中。同时,我们把信息熵、模糊数学和小波分析等概念渗透到部分章节中,并给出该理论解决问题的结果,以提高学生学习新理论的兴趣,促使部分同学自学新的理论,培养学生的自学能力。在讲述专业基础知识的过程中,我们将适时地增强相关的软件的学习和资源库的介绍,例如通过实验和实训的教学加强学生对Matlab和VC++等语言的学习和实践。通过CNKI和IEEE Tran文章的介绍,提高学生对最新科研成果的了解,激发学生学习的兴趣,培养学生对新事物的学习能力。鼓励学生进行大学生参加校内科研立项,引导学生分析问题和解决实际问题的能力,进一步提高学生的综合素质能力。

2.丰富教学方法。在以往的教学过程中,数字图像处理课程的教学主要以“填鸭式”教学方法为主,只注重对学生的教,而忽视了学生的学和做,没能产生良好的教学效果。通过对当前主要教学方法的研究与探索,我们丰富了数字图像处理课程的教学方法,以“启发式”教学方法为主,以综合运用讲授法、研究法、讨论法、实验法等教学法,把“教、学和做”很好地穿插起来,发挥各种方法的优势,引导学生积极参与教学,实现教与学深层次互动。促进学生对数字图像处理基本知识和方法的掌握及动手能力的培养。

3.提升教学手段。针对该门课程理论性强、乏味单调的特点,应用现代网络多媒体教学手段,借鉴当前较为流行的CDIO教学模式,进行教学手段的提升。结合教学内容的组合的优化和教学方法的丰富,在教学中以现代网络多媒体为教学媒体,通过制作多媒体课件,以“少而精”和“图文并茂”为原则,并结合Matlab和VC++等软件编程实例的案例教学,在课堂教学中适时引入前沿热点图例分析和编程处理实例,引导学生进行理论知识的学习,使学生体会到易学、乐学和会做。

4.改善考核机制。摒弃了以往“一考定乾坤”的考核方式,将平时出勤与课堂表现情况、作业和实验成绩等进行量化,纳入最终成绩的综合评核。并结合“3+1”创新教育模式对学生实践能力和CDIO培养大纲对学生素质进行全面考核的要求。侧重学生对基础知识的把握、个体实践能力、团队协作能力的考核。

三、实践效果

通过数字图像处理教学内容、教学方法、教学手段和考核机制等四方面的改革研究与实践,近几年本专业每年都有10%左右的学生选择数字图像处理的相关研究内容作为本科毕业论文选题,并取得了较好的成绩。通过对毕业生的跟踪调查发现,考研深造的部分学生也把图像处理及新兴相关学科前沿方向作为自己的学术研究方向,工作就业的部分学生也从事了与数字图像处理相关的研究工作领域。

四、结束语

本文对以往数字图像处理课程教学过程中存在的主要问题进行了简要的介绍,并对主要相关学者的教学改革内容进行了阐述。结合我校的教学理念以及本专业的“3+1”教学改革模式,针对本专业本科生的特点,进行了数字图像处理教学的改革研究和实践。实践表明,此次教学改革提高了教学效果,得到了学生的认可和好评。完成了对本专业学生在知识、能力与素质等方面要求的综合培养。

[基金项目:黑龙江省教育科学“十二五”规划研究课题(GBC1212076);黑龙江科技学院教学研究项目]

参考文献:

1.魏广芬,王永强,丁昕苗,何爱香.“数字图像处理”课程教学改革的尝试.电气电子教学学报,2009(6)

2.李向群,王书文.《数字图像处理》课程的教学改革初探.微计算机信息,2010(3-2)

3.吕朝辉.数字图像处理课程教学改革与实践.高教论坛,2010(11)

4.赵敏.MATLAB用于数字图像处理的教学实践研究.电脑知识与技术,2012(31)

5.查建中.CDIO:颠覆性的工科教育模式改革[J].中国远程教育,2009(3)

第6篇

关键词:注册;识别;图像获取

1.指纹识别技术的发展

在生活中较常见的指纹识别应用有:指纹锁、指纹考勤、指纹门禁、指纹保管箱、笔记本电脑指纹登陆模块、手机指纹开机验证模块、指纹网上银行。相信随着技术发展成熟,应用成本越来越低,指纹识别技术会越来越广泛地应用到我们日常生活中来。

指纹识别由于其电子门锁技术的成熟和成本降低,开始彻底走向民用。国内生物识别未来将形成上百亿元的市场,其中安防业是最重要的应用领域之一,市场空间很大。目前,罗湖口岸已经用了指纹通关,德国将指纹识别付款应用到某些超市中。预计指纹门禁、指纹读卡器、指纹智能锁,指纹门禁考勤一体机及相关指纹身份识别系统将会迅速普及到每一个安全防范项目和智能大厦,目前国内年门禁安装数量大约是在50万门以上,其中指纹识别的在门禁应用大概只有1%左右,而一般国外这个比例大约应为20%以上。换句话说,在国内安防业,生物识别产品的市场缺口在9.5万台左右,另一个比较明显的状况是,目前专门从事指纹读头和电子门锁指纹门禁生产和销售企业很少,所以综合起来看这个市场有两个明显的特点:市场大,竞争少。

社会在不断的进步,身份的鉴别工作也提出越来越高的要求,在各种生物特征识别技术中,历史最悠久、使用最广泛的无疑是指纹识别技术,是一种相对比较成熟的身份鉴别方法,无论是在科学研究还是在工业界的实际应用中都得到了人们的广泛关注。尽管指纹识别技术在研究与使用得到了关注,但其发展还是不能满足社会日益增长的需求,究其原因是指纹识别在识别率、稳定性以及识别速度等方面还不能够满足实际使用时的要求。

 2.指纹识别技术的应用

   毫无疑问,指纹识别技术具有广泛的市场前景,其社会效益及经济效益是具大的,一般的自动指纹识别技术都需要有四个过程,即指纹图像的获取、指纹图像的处理、指纹特征提取和指纹匹配,也就是说,指纹识别的大部分工作都是数字图像处理的工作,而本文的主要研究内容也是数字图像处理在指纹识别中的应用。在数字图像处理中,图像获取就是把一幅模拟图像(如照片、画片等)转换成适合计算机或数字设备的数字信号。这一过程主要包换摄取图像、光电转换、数字化等步骤,而指纹图像的获取就是通过一定的设备采集手指表面的指纹凹凸信息同时将之转化为数字信号图像的过程;而在指纹图像处理的过程中,包含了几种常用的图像处理手段,如图像增强,图像分割等,其中在图像增强的过程中又包含了灰度与对比度的处理过程,主要是为了突出图像中感兴趣的信息,衰减或去除不需要的信息,从而使有用的信息得到增强,便于目标区分或对像理解;指纹特征提取则是从经过预处理的图像中提取指纹特征;指纹匹配顾名思义是指匹配指纹的特征,从而进行识别。故对几幅指纹图像进行匹配一般是从图像中提取的特征进行匹配。

一般来说,指纹图像有全局特征和局部特征两大特征,能够反映指纹整体开关特征的是全局特征,这个特征的提取一般局于指纹分类;能够反映指纹细节特点是局部特征,这个特征一般用于指纹对比。指纹线中的中断点、交叉点及拐点是指纹的特征点。

指纹识别系统的主要工作分为两个阶段,即注册阶段与识别阶段,也就是提取指纹特征和识别指纹特征的过程。一般在注册阶段,都要求输入各自的用户名以及对应的指纹,该过程需要将手指放在专门的采集指纹窗口上,经过指纹识别系统的指定模块特征提取模块将输入指纹的特征提取出来,结合用户名形成一个数据库;识别阶段时,该系统会将输入的指纹与数据库中现在有的指纹中进行一系列的匹配,特征点特征线等,这个过程需要读取数据库中保存的指纹特征信息。通用的指纹识别系统的流程图如图1所示。

图1指纹识别系统

就使用情况看,现有的指纹识别系统通常分为两大类,即嵌入式系统和计算机终端指纹识别系统。嵌入式系统是一个独立的系统,它不需要其它的设备就可以完成工作,这方面的应用有指纹锁,指纹考勤机(此处的指纹考勤机需要定期连接设备读取存档)等;计算机终端的指纹识别系统的设计与使用则更加灵活,通过计算机的分配,可以使多个系统共同使用指纹数据库,若用在考勤设备中,则可以实时显示该工作人员是否在岗。

除了公司等地的考勤、安保等地,还有一个与我们是日常生活更为接近的使用场合,即笔记本的指纹识别系统,现在,有很多品牌的笔记本已经将指纹识别系统应用到计算机上,笔记本的指纹识别系统大概经历了两代,第一代的指纹识别系统使用的是光学识别系统,这种技术容易出错而且不稳定,而第二代指纹识别系统采用的是电容传感技术,利用小信号创建指纹图像的半导体设备,电容传感器产生的电子信号可以直接达到真皮层读取指纹图案,提高了整个系统的可靠性。

3.结束语

   指纹作为生物特征之一,其先天具有的不变性,唯

一性和可分类性,是公认的具有法律地位的个人身份特

征的可靠证据。指纹识别系统相对其他生物识别系统,

起点较早、种类最多应用最广泛,由于指纹识别系统成

本低,可以集成在很小的芯片上进行处理,已经普遍被

用来替换用户名/ 口令、电子令牌等传统的身份认证终

端设备。目前,指纹识别系统已用到了几乎所有需要进

行安全性防范的场合,遍及诸多领域。

参考文献:

[1] 郭浩.基于嵌入式隐Markov模型的指纹分类和匹配研究.[博士学位论文].大连:大连理工大学,2004

[2] Jain A K, Pankanti S. Automated Fingerprint Identification and Imaging Systems. Technical Report. Miehigan State University,1999.

[3] 李晓昆.基于结构特征的指纹识别.计算机工程与科学.1999,21(2):25~29

[4] 王崇文,李见为等.自动指纹识别系统的设计与实现.计算机应用.2001,12:63~65

[5] 章毓晋.中国图像工程及当前的儿个研究热点.计算机辅助设计与图形学学报,2002,14(6):489~193

[6] 高靖靖.指纹识别预处理算法研究:[硕士学位论文].成都:电子科技大学,2007

第7篇

关键词:表格图像处理;性能评测;表格版面结构;线条交点

中图分类号:TP751文献标识码:A文章编号:1009-3044(2007)03-10754-02

1 引言

随着图像处理技术的不断发展,对文档图像的处理已经从一个字符识别器发展到一个复杂的包含图文分割、公式识别、表格识别等功能的智能化系统。其中表格图像最为常见,对于表格图像的识别也是DIP(Document Image Processing)领域的一个研究重点[1]。

表格图像中表格结构的存在是不确定的,表格结构存在的数量和位置也是不固定的。表格图像处理的目的就是从包含有表格数据的图像中定位出表格的位置,然后再对表格内部版面结构进行分析,最后按照某种格式保存,变成计算机能够处理的表格信息。表格图像处理技术是一个有相当难度的课题[1],许多处理方法不尽完善,需要不断探索,针对表格图像处理系统建立一个完整的评测体系尤为重要。目前的评测方法主要有两种:一种是手工评测,一种是自动评测。手工评测是由评测人员用肉眼来观察处理结果的好坏,自动评测是利用评测软件分析系统的处理性能,评测过程是自动或半自动的。

本文针对表格版面结构定位与分析的性能评测问题展开研究,在前人提出的“线条交点矩阵”匹配的评测机制[8]基础上,做了优化和改良,建立了完整的评测系统,最后,基于南开大学机器智能研究所RTK系统,进行实际的测试分析,得出实验结果。

2 表格图像处理自动评测模型

2.1 性能评测基本概念

首先我们引入DIP系统评测机制中使用的概念:

(1)性能评测(Performance Evaluation):根据一系列基准数据对系统进行性能测试。

(2)理想系统(Ideal System):相对实际待评测系统而言的,是个理想化的系统,对于一定的输入,产生期望的输出。每个实际系统都有个对应的理想系统。

(3)测试样本(Test Sample):在系统测试或者评测过程中需要的对实际系统的输入。

(4)测试基准(Ground Truth):就是标准结果,测试样本输入理想系统得到的结果[3]。

(5)处理结果(Processing Result):将测试基准作为实际系统的输入,得到的结果就是处理结果。

(6)评测机制(Evaluation Mechanism):包括确定评测内容、设计评测方法、制定评测标准和评测参数、选择评测样本、监督评测实施和分析评测结果。

2.2 自动性能评测流程

图1简单描述了表格图像处理性能评测的流程:

图1 性能评测流程简图

其中标准结果是评测系统的一个基准,它是表格的所有线条和交点的集合,我们构建一个数据库来存放表格的标准结果;实际系统是我们待评测的表格处理系统;评测函数是自动评测的核心。一个有效的评测算法是做到自动评测的关键[4],本文采用的是“线条交点”的评测机制,从整体和局部都能找到错误的原因,为表格图像的处理性能提高和完善提供指导信息;性能评测的结果是评测的比较结果,我们以图形和表格等信息来描述评测结果。

2.4 基于线条交点的评测模型

表格的复杂版面结构可以用表格中水平和竖直线的交点来描述,如图2是一个表格图像,它的结构可以用图3所示的线条交点来描述,其中表格边线缺失的情况用虚线补齐。

图2

图3

(1)表格版面结构定位的评测算法思想。采用由粗到精的比对算法对表格结构的定位性能进行评测,将表格定位的处理结果与标准结果相比较,如果处理结果正确,那么它的表格定位的位置和标准结果应该一致(实际算法考虑阈值范围),否则存在识别错误,我们以此为标准来判断处理结果中表格是否被定位。确定了表格是否被定位以后,再根据表格定位区域的区域是否标准结果区域重合来判断定位的精度。

(2)表格版面分析的评测算法思想。表格图像经过处理以后得到的版面结构是一个单元格(由行线和列线围成的的最小矩形区域)链表,基于单元格对版面分析的结果的描述是一个非常复杂的问题(单元格为二维结构,其合理处理结果表现为二维平面的可接受面积),所以通过直接比较单元格链表的方法来评测版面分析的结果好坏,实现起来比较困难,效率也很低。

通过大量的实践和观察,我们发现两个规律:(1)线条交点可以确定单元格;(2)线条交点的关联性可以判断单元格的正确性。因此我们可以通过比较表格线条交点的关联性来确定单元格匹配是否成功。算法的实现过程见流程图4:

图4 表格评测算法整体流程

3 表格图像处理性能评测环境

首先,挑选了100页样本作为本次实验的数据,并且对其进行了详细分类:

表1是根据图像的效果进行分类,表2是根据表格的数目进行的分类:

表1 测试样本分类统计表

表2 测试样本分类统计

这些样本图像文件放在一个单独的目录TableImageSet中。

其次,我们对所选的100页样本的处理结果做了人工评测,因为样本数目较小,所以得到的结果是准确和有效的,将它作为评测系统的衡量标准,来衡量自动评测系统的结果,由此可以得出本系统的可靠性和有效性。

该自动评测系统在VC6.0环境中开发,运行环境是Pentium4,CPU 1.80GHz。下面一节将对评测的结果进行分析总结。

4 实验结果

我们以TableImageSet中的样本集作为输入数据,以RTK7.0的表格定位与分析模块为评测对象,用我们的程序对其进行性能评测。首先分析其表格版面结构定位性能,得出表3的结果,然后针对定位正确的表格进行结构分析的评测,得出表4的结果。

这些评测数据不仅反映出表格处理系统的整体性能,还定量的给出了系统的错误的所在,使开发人员可以根据错误的发生情况,对系统进行有针对性的改进。

参考文献:

[1]C. Peterman, C.H. Chang, andH. Alam. A system for table understanding. InProceedings of the Symposiun on Document Image Understanding Technonogy(SDIUT'97),pp. 55-62, Annapolis, MD, April/May 1997.

[2](美)Mark Fewster &Dorothy Graham. 软件测试自动化技术与实例详解[M], 电子工业出版社.

[3]Jianying Hu,Ramanujan Kashi,Daniel Lopresti,George Nagy,Gordon Wilfong. "Why Table Ground-Truthing is Hard." ICDAR 2001(Djvu) pp.129-133.

[4]V. F. Margner, P.Karcher, A.K.Pawlowski. "On BenchMarking of Document Analysis System", August, 1997. Proceedings of 4th International Conference Document Analysis and Recognition, Ulm, Germany(ICDAR'97). pp. 331-336.

[5]G. Nagy, "Document image analysis: Automated performance evaluation," in Document Analysis s\Systems, A. L. Spitz and Dengel, eds., pp. 137-156, World Scientific, Singapore, 1995.

[6]Jing. Hu, R. Kashi, D. Lopresti and G. Wilfong, "Table Structure Recognition and Its Evaluation", SPIE Document Recognition and Retrieval VIII San Jose, California, January 2001.

[7]Jianyin Hu, Ram Kashi, Daniel Lopresti, Gordon Wilfong, "Medium-Independent Table Detection", in Proceedings of Document Recognition and Retrieval VII (IS&T/SPIE Electronic Imaging),volume 3967,California,USA,January 2000,pp.291-302.

第8篇

关键词:结构化局部边缘模式;文档图像;模式分类

目前,文档图像具有很多种模式形态,其分类方法也多种多样。在过去,人们比较常用的分类方法是光学字符识别系统,该系统主要根据文本特征、结构特征、混合特征三种方法对文档进行识别分类,但是该分类方法的分类速度比较慢,对所处理图像解析度的要求比较高。因此,该方法逐渐被结构化局部边缘模式分类方法所替代。

1 结构化局部边缘模式下处理图像分类的预备知识

文本管理工作主要包括:压缩、管理、归档、文本分析等,在进行文档工作处理的时候,相对准确的文档类型信息能够有效的提高文本检索的速度以及工作人员的工作效率。文档具有多种模式形态,每种形态都有自己的独特性以及形态之间的相似性。结构化局部边缘模式的使用,不仅可以实现对图像分割模式的自由调节,还能够有效的提高文档图像特征提取的准确性,在使用结构化局部边缘模式进行文档图像特征提取的时候,采用的是图像区块之间重叠的方法,通过这种方式有效的确保图像分割区域特征本身的连贯型性。

2 采用结构化局部边缘模式下,文档图像分类特征的提取

本文在对结构化局部边缘模式下文档图像分类处理的研究中,进行分类对比采用的是HOG。结构化局部边缘系统通过LEP特征,根据图像像素邻域的边缘方向进行了相关的编码。文档图像本身特征就比较明显,例如影像图片的像素数值变化比较大;一般学术论文的格式比较规整且字数比较多;灰度图像之相似性比较大,没有明显的规律可循;表格文件的特征性比较明显,横线和竖线比较多;PPT幻灯片的图像、文字等变化性比较明显,但是在排版方面具有一定的规律可以遵循,为了方便结构化局部边缘模式在处理文档图像方面的研究工作,上述几种图像类型的边缘信息都比较明显。

3 结构化局部边缘模式和HOG的主要特征

3.1 模式分类框架

文中在进行结构化局部边缘模式下,文档图像的分类处理研究中,还没有形成一一个完整通用的基准数据库进行相关的实验研究,并且受其它因素的限制也比较明显。所以,本文在进行处理研究的时候,通过综合对比研究选取了含有5000张图像并具有四种文档图像类别,每种类型都包含1250张图像,类型包括:影像图片、学术论文、PPT幻灯影片以及含有表格的文件。另外,在进行文档图像处理研究时,图片都是随机获取的。

3.2 结构化局部边缘模式的特征描述

结构化局部边缘模式主要是利用计算机模拟技术对对视觉、图像等进行处理,在使用的过程中,根据图片中重复出现的不同pixel,并将其按照不同的方向延伸成九宫格的形状作为参考的重点。在模式计算的过程中,首先要获取到原始的边缘图像,并建立一个3*3的邻域窗口,在这一过程中,文本会被分为比较小的空间区块,其计算方式为:结构化局部边缘模式(SLEP)=Ni/N,i=0,1,2,…31,其中结构化边缘模式的变化范围是在0到31之间,Ni中的i代表的是pixel的数目,n代表的是piexl的总数目。

3.3 HOG的特征描述

HOG特征是目前人们比较常用的图像特征提取方法,该方法在计算的时候选取的是320*256的图像区域,在此基础上,把区块的大小划分为32*32,其中九宫格的大小为16*16,将九宫格的每一格作为最基本地计算单元,然后进行相关的串联计算。方法步骤如下。第一,可以对图像进行卷积处理,目的是了解图像中像素的梯度以及方向变化,一般将范围值控制在[-1,0,1]或者是[1,0,-1]。第二,对每个格子进行量化处理,角度量化的范围值是[0,180],然后根据每个像素的模建立九维方向角直方图。第三,把区块内部各格子之间的直方图进行串联处理,然后组成36维直方图的特征向量。第四,把所有的特征向量串联在一起,就会形成最后的直方图特征向量。

4 结构化局部边缘模式的处理分析

在对上述四种类型的图像特征进行信息提取研究以后,了解到在进行图像分析的过程中,图像的解析度分别为:80*64,160*128,这组数据说明和HOG相比,结构化局部边缘模式在运用过程中性能效果比较好,分辨率也比较高。这说明结构化局部边缘系统在不适用OCR系统的条件下,也具有高质量的文档图像分辨率。当图像大小为80*64,文档图像的类别为影像照片以及规范化的学术论文的时候,SLEP测试效果要比HOG高0.1到1.6个百分点,但是当进行表格文件处理的时候,百分点就会比HOG的百分点低,当进行PPT幻灯片测试的时候,百分点又会比HOG高,这表明,结构化局部边缘模式在文档图像处理的时候,使用整体效能比较高。当图像大小逐渐变大的时候,除表格文件的测试百分点比较低之外,其余也呈现逐渐增高的现象。上述研究表明,当图像文档比较混乱的时候,梯度方向呈现混乱的状态,进行文档图像、影片特征分类会比较方便,但是在进行表格文档处理的时候,使用HOG取得的效果会更加的明显。

[参考文献]

第9篇

关键词: 三维坐标; 多目视觉; 双目交汇; 硅棒; 特征点

中图分类号: TP 274.2文献标识码: Adoi: 10.3969/j.issn.10055630.2013.02.001

引言硅棒的实际尺寸参数与硅棒本身的特征点提取密切相关,获取硅棒特征点的三维坐标信息可有效反映硅棒尺寸参数和产品质量,为产品的质量监控提供依据[1]。然而针对硅棒,无论是整体尺寸还是局部特征的检测,国内目前尚无相关仪器,在我国这些参数的检测还主要是依靠人工完成[2]。人工检测是一种非在线、接触式的传统检测方式,采用直角尺、游标卡尺、钢板尺等工具进行检验,检测精确度和重复性受到检测人员工作状态干扰,很难保证统一标准,总体上来说检测速度和检测精度不高;同时接触式检测过程中需反复搬动样品不可避免地造成对样品的二次伤害,效率低,仪器损耗大[2]。结合视觉成像技术和图像处理技术出现的机器视觉检测技术,不仅摒弃了传统检测方法的不足,满足了实时检测要求,同时还具有非接触、精度高等优点,是现场实时三维坐标测量的首选方法之一[35]。国内外关于三维坐标的相关测量方法主要有:电子经纬仪法和三坐标测量机法[3]。坐标测量机的测量精度可达微米级,但是庞大的机身、厚重的底座、复杂的操作以及昂贵的成本限制了其现场的应用[4];经纬仪、激光跟踪仪便携性好,但采用多点对准,效率低,不适合于现场在线检测[5]。机器视觉检测系统组建非常灵活,既可由单目视觉测量系统构成,亦可选择双目甚至多目视觉测量系统搭建而成。因为单目视觉测量三维空间坐标测量不确定度偏差较大[4],所以选择由四CCD构成的多目视觉系统,该多目视觉检测系统中,相邻的两CCD构成正交双目交汇视觉测量子模块系统,基于双目视觉原理的子模块克服了单目视觉检测的缺陷,精度更高。该多目机器视觉系统在保证较高精度的前提下,作为机器视觉前端采集系统,实现了硅棒全范围大尺寸轮廓检测,检测效率和速度较高。1硅棒坐标检测机器视觉系统组成典型的基于机器视觉的硅棒坐标检测系统组成如图1所示:

图1机器视觉的坐标检测系统组成

Fig.1The design of machine vision for coordinate detection system

硅棒坐标测量系统主要包括上位机界面、数据采集模块、图像处理模块、输入输出接口以及机械搭建平台组成。上位机作为人机交互平台负责数据显示和存储,总体管理数据采集模块和图像处理模块。数据采集系统作为机器视觉检测的核心之一完成硅棒轮廓信息图像采集,涉及光源、镜头、CCD相机以及图像采集卡,采集系统工作流程为:光源照射待测硅棒,CCD相机采集图像信息经过图像采集卡将图像信息转换为数字信息送入上位机并实时保存起来。数据采集完成之后,图像处理模块读取图像通过相应算法提取特征点最终计算特征点空间三维坐标。图1还可以看出整个数据采集模块搭建在机械平台上由执行机构驱动,不仅可以实现待测目标的小范围检测,同时还可以配合机械平台运动,驱动数据采集系统实现待测物体的大范围全尺寸检测。2硅棒特征点三维坐标检测原理

2.1四目视觉全范围检测系统组成硅棒特征点坐标视觉检测技术基于四目视觉原理,整个四目视觉系统作为机器视觉检测系统的数据采集模块负责为后续图像处理模块提供硅棒图像信息,采集的图像质量直接影响到后续图像处理的难易程度和结果的计算精度。四目视觉原理如图2所示:数据采集模块由四台CCD相机组成,分别在待测硅棒每个侧面安装一台CCD面阵相机,保持相机与硅棒待测面垂直放置,在自然光源照射下硅棒表面成像于与之垂直的CCD相机上,则相机分别获得每个硅棒表面特征的图像。该图像可以通过一个四路camelink接口图像采集卡或者2个双路camelink接口图像采集卡送入上位机进行后续图像处理。整个数据采集系统要实现的功能就是确保不降低系统检测精度的前提下,维持尽量大的有效视场范围,实时采集获取清晰的硅棒图像。

2.2四目视觉系统视场约束为了实现最优检测目的,必须保证待测硅棒在检测过程中始终处于四目视觉系统的有效视场范围内,若硅棒对应于相机上像点的坐标为(xi,yi),通过针孔模型透视变换公式就能得出某个特征点在有效视场内的世界坐标为OXWiYWiZWi。图3为四目视觉系统有效视场示意图,以四台CCD交汇中心建立世界坐标系。

图2四目视觉系统组成

Fig.2The composition of the 4 CCDs

vision system图3四目全范围检测原理及有效视场分析

Fig.3The principle and the analysis of effective

vision field for 4CCDs′ full range detection

如图所示:四台面阵相机型号相同,焦距f均为镜头中心到CCD靶面中心的距离,相邻相机之间的基线长度均为B(B=O1O2=O2O3=O3O4=O4O1),O1Xc1Yc1Zc1、O2Xc2Yc2Zc2、O3Xc3Yc3Zc3、O4Xc4Yc4Zc4是分别以CCD相机各自的镜头中心建立相机坐标系,以CCD1和CCD2光轴的交点为原点建立世界坐标系OXWYWZW,O1Xc1Yc1Zc1、O2Xc2Yc2Zc2、O3Xc3Yc3Zc3、O4Xc4Yc4Zc4均位于OXWYWZW内,最终计算时必须将O1Xc1Yc1Zc1、O2Xc2Yc2Zc2、O3Xc3Yc3Zc3、O4Xc4Yc4Zc4这四个相机坐标系转换到同一个参考坐标系OXWYWZW。假设CCD相机像平面平均尺寸为2Tx×2Ty,相邻相机光轴夹角为2α,则四目视觉系统的有效视场为ABCDEFGH围成的八边形。为了准确描述有效视场,在八边形ABCDEFGH内做内切圆,内切圆面积就反映有效视场的大小,采用内切圆的半径R对有效视场进行描述。考虑Tx远远小于焦距f,则有效视场R可以采用如下近似公式描述:R=Bcosβ/2sinα=Bcos(arctan(Tx/f))/2sin45°≈22BTx/f(1)由式(1)可知:CCD相机间基线长度B、视场角β以及相机夹角α这三个参数不仅直接限制有效视场的大小,还会严重影响四目视觉系统的测量精度。引起测量精度的误差包括相机本身参数(Tx、Ty)以及相机分布结构参数、参数本身的测量误差(B、f)[6],它们共同决定了机器视觉采集系统的精度。

2.3双目交会原理如图2可知:四目视觉系统中的任意相邻的两个CCD构成双目交汇视觉测量系统,所以整个四目视觉系统可以看作四个双目交汇视觉子系统组成,其中CCD1和CCD2构成子系统1,CCD2和CCD3构成子系统2,CCD3和CCD4构成子系统3,CCD4和CCD1构成子系统4。因为每个子系统光轴互相垂直,所以子系统基于正交双目交汇视觉原理。正交双目交汇测量比单目测量准确度高,它的相机夹角2α=90°有效降低安装误差[7],保证基线长度,形成相对较大的有效视场利于实现大尺寸检测,同时α=45°满足α∈(40°-70°)放置时测量误差最小要求[4]。以双目交汇视觉子系统1为例:CCD1和CCD2分别满足针孔成像模型:zc1 u

(3)其中矩阵M是由相机内部参数(r1~r9)和相机外部参数(T1~T3)构成的一个3×4的综合矩阵。联立式(2)和式(3)求解则可得到CCD1和CCD2的采集图像上的公共特征点的三维坐标,即硅棒第1对棱边上的特征点坐标,同理对于双目交汇视觉子系统2、双目交汇视觉子系统3、双目交汇视觉子系统4可依次求得第2对、第3对、第4对棱边上的特征点坐标,从而在保证精度前提下实现硅棒全范围检测目的。3硅棒特征点三维坐标检测方法的实现为了验证硅棒特征点三维坐标视觉检测系统的可行性,在实验室搭建了机器视觉检测试验样机进行试验,完成四目视觉采集系统的相机标定实验,同时以CCD1和CCD2构成的正交双目子系统为例进行一对硅棒表面图像的数据采集实验,基于Visual Studio 2008平台编写核心图像处理算法。

3.1标定实验相机标定是视觉测量过程中不可缺少的关键技术,标定通过针孔成像原理求取相机内部属性参数和外部位置参数从而确定空间坐标系中物点和像点的对应关系[8]。针对本文的多目视觉系统首先对每个相机进行单目标定。单目标定选择一种介于传统标定技术和自标定技术之间的方法:张氏平面标定法。标定流程为:首先将自制一个大小为11×11标准棋盘格模板,每个棋盘格大小为10 mm×10 mm。该模板置于视觉系统有效视场内,改变模板位置多角度(不小于3个)分别拍摄,拍摄完成后进行角点检测,单应性矩阵求解和参数优化,每个CCD获得一个相应的相机标定文件calib_CCD_1.mat、calib_CCD_2.mat、calib_CCD_3.mat、calib_CCD_4.mat。这种标定方法比传统标定简单,算法计算量减少且精度高于自标定方法。通过单目标定得到X方向和Y方向有效焦距(ax,ay)、CCD靶面中心坐标(u0,v0)以及径向或者切向畸变等相机内部参数,由于切向畸变较小,此处忽略不计,主要考虑径向畸变参数(k1,k2),单目标定结果见表1。单目标定完成之后进行立体标定,分别获得相机坐标系O1Xc1Yc1Zc1、O2Xc2Yc2Zc2、O3Xc3Yc3Zc3、O4Xc4Yc4Zc4相对于世界坐标系的旋转矩阵R和平移矩阵T。立体标定结果见表2。表1单目相机标定结果

Tab.1The result of monocular camera calibration

CCD1CCD2CCD3CCD4(ax,ay)(1 537.644 971 864.834 93)(1 533.415 091 857.500 18)(1 535.344 071 860.932 01)(1 539.700 31 865.793 31)(u0,v0)(350.602 11272.778 93)(360.149 42285.268 16)(357.021 19279.775 49)(351.339 08288.441 09)(k1,k2)(-0.382 631.710 26)(-0.372 052.034 223)(-0.367 811.901 27)(-0.380 091.947 37)像素误差(0.321 280.370 39)(0.275 690.223 16)(-0.332 810.201 27)(-0.339 610.291 27)

表2多目相机标定结果

Tab.2The result of multicamera calibration

O1Xc1Yc1Zc1O2Xc2Yc2Zc2O3Xc3Yc3Zc3O4Xc4Yc4Zc4R10010.003 70.04310.002 90.004 310.003 70.040 3010-0.003 61-0.006 50.043 61-0.046 5-0.007 11-0.047 3001-0.004 50.066 81-0.003 90.061 71-0.006 50.057 91T0.242 81 000.229 00999.233 70.100 20.297 50.441 70.020 9-998.001 90.199 51 002.336 70.019 7

图4硅棒图像

Fig.4Images of silicon rods3.2图像采集实验实验采用四个IMPERX面阵CCD相机、相机配接15 mm的标准镜头,两个X64CL Prio图像采集卡,两个镜头基线距离为1 408.6 mm搭建实验样机,有效线视场为236.544 mm,将待测硅棒置于CCD交汇的有效视场范围内,配置图像采集卡输出格式为Cameralink Base Mono #1,导入IPX_VGA210相机.cfg配置文件,通过X64CL Prio图像采集卡将一对像素为640×480黑白硅棒图像实时送入上位机。其中正交双目视觉子模块1采集到的一对图像如图4所示。

3.3图像处理特征点坐标检测视觉系统第二个核心组成是图像处理模块,该模块通过完成对采集数据的后续图像处理获得目标特征点的三维空间坐标,技术难点在于机器视觉数据采集模块中CCD相机得到的是二维图像信息,而系统最终要求是得到目标特征点的空间三维坐标。针对问题论文提出一种二维图像上恢复特征兴趣点三维坐标的解决方法:首先提取待处理图像上的特征兴趣点,建立特征兴趣点对应关系即同名点识别,接着通过同名点立体匹配获取对应点视差从而得到特征兴趣点3D坐标。

3.3.1Harris角点检测论文以硅棒角点作为研究的特征兴趣点,采用一种基于灰度值相关的角点检测算子:Harris算子进行硅棒角点检测。Harris角点检测的目的是提取待测目标的特征点,依靠特征点来传递图像所表征的参数信息,算法不受相机姿态及光照影响,检测精度达到像素级别[9]。Harris算子数学表达形式为:M=G(S)gxgxgy

gxgygy(4)

I=Det(M)-k×Trace2(5)M为自相关联系矩阵、Det(M)为自相关矩阵行列式的值,Trace为矩阵的迹,k为默认常数,取0.04。式(5)称为Harris算法响应函数,该函数给出局部范围内的兴趣值大小。Harris算法采用局部范围内的极大兴趣值对应的像素点作为特征点,因此通过对算法中的门限阈值、局部邻域大小、高斯窗口大小和高斯方差多次调整,保证在局部邻域内只留下最大极值点作为兴趣点,实现特征最优角点的提取。

3.3.2特征点立体匹配特征点立体匹配就是在待匹配图像上寻找标准图像上每个特征点的同名点,从而将不同图像中原本独立的特征兴趣点联系起来[1011],特征点匹配不是盲目进行,它遵循一定约束条件,本文同名点匹配基于极线约束。极线约束规定了一幅图像上任意一点在另一幅图像上的对应点只可能位于一条特定的极线上,通过该约束特征点匹配搜索空间从二维降为一维,减少计算量[10]。匹配流程为:首先在现有图像中设定一个标准图像,对于标准图像中的特征点Pl,找出待匹配图像中与其有最近欧氏距离的前两个特征点Pr1和Pr2,计算两个特征点中最近的距离Dmin与次近的距离Pcmin的比值,如果该比值小于匹配阈值,则表示待匹配图像上欧氏距离最近的点是标准图像中Pl特征最优匹配点。其次以待匹配图像中Pr1为特征点,重复步骤1的过程,求取标准图像中Pr1的候选匹配点P′l。最后如果Pl 和P′l是相同点,则Pl 和Pr1匹配成功,否则弃之。重复这个流程,直到匹配完成。同名点匹配完成之后,由双目视觉视差公式即可得出特征点3D坐标。最后对采集系统拍摄的两幅硅棒图像进行角点检测及匹配算法验证,获得了图像中的4对公共角点3D点坐标值,结果见表3。

表3特征点3D坐标计算结果

Tab.3The calculation result of characteristic points′ 3D coordinatemm

特征角点X实测值X理论值Y实测值Y理论值Z实测值Z理论值153.59154-79.833-80.5-63.422-63263.32263-80.032-80.5-53.709-54353.6195480.20080.5-63.192-63463.2096379.90280.5-53.991-54

通过表3可以看出:理论计算结果和实际测量结果基本吻合,且实际测量精度明显高于理论计算精度。4结论论文提出一种基于机器视觉的非接触、实时硅棒特征点检测技术,搭建了多目视觉硅棒采集系统进行图像采集实验,重点研究了多目视觉有效视场确定和正交双目交汇视觉测量原理,基于Visual Studio 2008平成了硅棒角点特征提取以及同名角点立体匹配等后续图像处理算法,整个检测过程时间不超过0.5 min。实验结果表明,该技术可准确快速获取待检测硅棒的特征点三维坐标,检测精度可以达到像素级别,适合于硅棒参数的非接触式高精度检测。为下一步开展硅棒面形检测研究奠定了基础。参考文献:

[1]郭海霞,解凯.焦点检测技术研究[J].哈尔滨师范大学自然科学学报,2007,23(2):73-75.

[2]徐岳生,刘彩池,王海云,等.直拉硅的现状与发展[C]∥中国有色金属学会第六届学术年会论文集.长沙:中南大学出版社,2005:62-69.

[3]彭凯,刘丽冰.双摄像机光学三坐标测量系统的研究[J].工艺与检测,2008,10(9):115-117.

[4]彭凯,刘丽冰,刘书桂.基于双相机的计算机视觉坐标测量系统[J].光电工程,2008,35(7):95-98.

[5]管业鹏,童林夙.双目立体视觉测量方法研究[J].仪器仪表学报,2003,24(6):581-588.

[6]刘佳音,王忠立,贾云得.一种双目立体视觉系统的误差分析方法[J].光学技术,2003,29(3):354-360.

[7]郭玉波,姚郁.双目视觉测量系统结构参数优化问题研究[J].红外与激光工程,2006,35(增刊):506-509.

[8]罗世民,李茂西.双目视觉测量中三维坐标的求取方法研究[J].计算机工程与设计,2006,27(19):3622-3624.

[9]张春生.基于点特征匹配的SUSANHarris算子比较[J].西安科技大学学报,2007,27(4):608-616.