基于数学形态学的车牌定位算法
电子信息工程 项振武 指 导 教 师 陆建华
摘 要:车辆牌照的自动识别是智能交通系统中的一项重要技术,而车辆牌照的定位又是车牌识别的关键点之一。本文针对车牌自动识别系统中的车牌定位问题数学形态学的定位方法。整个处理过程分为图像预处理、边缘提取、车牌粗定位、车牌精确定位四大模块,用同时对其中出现的问题进行了具体分析、处理,寻找出对于具体的汽车牌照识别过程的最好的定位方法。实验结果表明,对于各种情况下的车牌图像,该算法都能有效地对车牌进行定位,具有定位准确率高,运行速度快,抗干扰性强的特点。
关 键 词:
1 引言
1.1 背景近年来,随着人们收入水平的提高,汽车产能的提高和成本的降低,私家车正逐步成为国人的出行工具。据中国汽车工业协会最新发布的数据显示,1379.10万辆,同比增长增长46.15而汽车销量的增加的前提条件是国家公路通车总里程的增加,尤其是国家交通主干道——高速公路的增加。发展,通车总里程继续稳居世界第二。汽车和高速公路的增加,对车辆的有效管理提出了更高的要求。如果对汽车牌照能够正确识别,就可以实现在交通路口、高速公路、军事要塞、机关大门等对过往车辆的实时登记、流量统计和对防卫目标的安全警备,对肇事车辆、被盗车辆、犯罪车辆进行辨识和拦截;就可以实现在汽车停车场对进出的车辆进行登记、统计和查询,以保障安全,并可
MATLAB软件编程来实现每一个部分,最后定位出汽车牌照。在研究的48.30%,比上年净增426.43万辆,据悉截止09年底全国高速公路总里程达到第444.60万辆;汽车销量首次超越美国成为世界第一的汽车生产和消费国。
页 共21页
,提出了一种基于 2009年中国汽车产量为13.486.5万公里,再次保持了高速图像处理,汽车牌照,数学形态学,车牌定位
万辆,同比%,比上年净增1盐城师范学院毕业论文(设计)
协助自动计费。而这些都是建设智能交通系统不可或缺的部分。以上这些促使车牌识别技术成为了一个热门课题,市场应用前景非常广阔。
在智能化交通管理中,汽车牌照识别系统利用每一辆汽车都有唯一的车牌号码, 通过摄像机所拍摄的车辆图像进行车牌号码的识别,而车牌定位是车牌识别技术中关键的一步,因此研究车牌定位具有重要的现实应用意义。
下面举个防止车辆通过“换卡”逃费的例子。
在封闭式收费中,通行费的依据是车辆的出入口和车型类别,这些信息通常被记录在由入口发放的一张就可能出现车辆间利用互换通行卡而偷逃通行费的情况。下面举例子说明这种情况:如1.1和丙站的入口卡,中途,A、B分别出示并交回丙站和乙站入口卡,这时,系统分别按站进入到甲站计算通行费,两车都逃掉了乙站与丙站之间的通行费。 这种舞弊行为经常发生在营运车辆中,路程越长,问题越为严重。为了解决这种问题,一个有效的办法是在通行卡中加入持卡车辆的牌照号信息,目前有些系统采用人工输入牌照号的办法,但这样不仅给收费员加大了劳动强度,而且增加了车辆的等待时间,同时人为舞弊行为也很难杜绝。有效的解决办法是利用牌照自动定位识别系统。
在入口处,利用牌照定位识别系统将车辆的牌照号自动地定位并录入通行卡中,在出口处再次识别车牌号,并与通行卡中的车牌号核对,从而保证车与卡的唯一对应,从根本上杜绝了换卡逃费现象的发生。1.2 车牌定位技术在车牌识别中,最重要的步骤就是车牌定位,定位的成功与否以及定位的准确程度将会直接决定后期能否进行车牌识别以及识别的准确度。车牌定位的主要工作是从摄入的车辆图像中找到车辆牌照所在的位置,并把车牌从该区域中准确的提取出来,供后续的字符分割使用。由于在现实中,汽车的车牌图像受到光照、背景、车型等外界干扰因素以及拍摄角度、远近等人为因素的影响,造成图像受光不均匀,车牌区域不明显,给车牌区域的
IC卡(或其他通行券)上,但是如果通行卡中不包含车辆的身份信息,A、B两车分别从乙丙两站进入高速公路相向而行,并分别领得乙站A、B相遇并交换入口卡,然后分别从丁站和甲站下路,下路时,A从丙站进入到丁站、
甲 乙 丙 丁 图1.1 高速公路“换卡”逃费演示图
第2页 共21页
B从乙所示,若
盐城师范学院毕业论文(设计)
提取带来了较大的困难。
车牌定位方法是在图像处理的基础上,对图像进行分析、总结并经过大量的实验确定的,定位方法的研究与车牌特征和图像处理技术是分不开的。同时在车牌识别系统中,牌照的定位准确与否直接影响到字符分割和字符识别的准确率。
车牌定位系统通常包括图像预处理、牌照搜索、图像裁剪耽搁部分。图像预处理包括将图片转换成灰度图,获得有用的图像边缘并将其二值化,削弱背景干扰;牌照搜索得到可能的候选区域;区域裁剪是从候选区域中剔假取真,提取真正的车牌。
基于数学形态学的汽车车牌的定位过程主要包括图像的预处理、利用数学形态学对进行车牌粗定位和利用行列扫描对车牌精确定位三个关键环节。其流程如下:
原始图像:由数码相机或其它扫描装置拍摄到的图像。图像预处理:对灰度图像进行灰度化、增强等操作以克服图像干扰。边缘提取:通过微分运算,二值化处理,得到图像的边缘。车牌定位:再利用行列扫描对车牌精确定位。本文以本人用数码相机在校园内拍摄的汽车牌照图像为例,结合图像处理、数学形态学各方面的知识,利用2 数学形态学基本理论2.1 数学形态学的简介形态学(来随着图像处理技术的发展而与图像处理技术相融合,并最终发展成为一种研究、处理图像的全新方法——数学形态学数学形态学的基本思想是用具有一定形态的结构元素去量度和提取图像中的对应形状以达到对图像分析和识别的目的。数学形态学可以简化图像数据,保持它们基本的形状特性,并除去不相干的结构。数学形态学是由一组形态学的代数运算子组成的,它的基本运算有4中各有特点。基于这些基本运算还可推导和组合成各种数学形态学实用算法,用它们可以进行图像形状和结构的分析及处理,包括图像分割、特征抽取、边界检测、
原始图像 图像预处理 边缘提取 车牌定位 图1.2 车牌定位流程图
利用数学形态学对进行车牌粗定位,对车牌区域进行扩张,车牌倾斜校正,
MATLAB编程,实现了从车牌的图像预处理到定位的完整过程。
Morphology)是生物学的一个分支,用于研究动物和植物的形状与结构,后1(Mathematical Morphology)。
、腐蚀(或侵蚀)、开启和闭合,它们在二值图像和灰度图像 图像滤波、
第3页 共21页
个:膨胀(或扩张)盐城师范学院毕业论文(设计)
图像增强和恢复等。
随着计算机、图象处理、模式识别、计算机视觉等学科的发展,数学形态学目前正在蓬勃发展。它以形态学的方法来研究和分析图像,具有其他方法无法替代的作用。目前在机器人视觉、医学图像分析等领域,数学形态学已作为其图像处理与分析系统的基础,并由此来考虑系统的体系机构,其应用取得了非常的成功。
事实上,数学形态学已经构成一种新型的图像处理方法和理论,形态学图像处理已成为计算机图像处理的一个主要研究领域。这门学科在计算机文字识别、计算机显微图像分析、医学图像分析、工业检测、机器人视觉等方面都取得了许多非常成功的应用。有些计算机图像处理和分析系统把形态算作为基本运算,由此出发考虑体系结构。一些形态学的算法,已经做成了计算机芯片,许多研究成果已经作为专利出售,其影响已波及与计算机图像处理有关的各个领域,包括图像增强、分割、恢复、边缘检测、纹理分析、颗粒分析、特征生成、骨架化、形状分析、压缩、生成分析及细化等诸多领域。2.2 数学形态学的分类
根据图像处理的对象及要求的不同,数学形态学可分为二值数学形态学、灰度数学形态学、模糊数学形态学、软数学形态学、模糊软数学形态学以及形态小波。(1)二值数学形态学
最初,由Maheron和Serra提出的数学形态学研究以二值图像为对象,称为二值形态学。数学形态学中的二值图像的形态变换是一种针对集合的处理过程。表示结构元素,那么用B对A进行膨胀的结果就是图像属于结构元素)后的并集,而腐蚀的结果是图像数学表达式分别为:
AB =∪ {A + b ∶b ∈B } A⊙B =∩ {A - b ∶b ∈B } 膨胀可以填充图像中的小孔(相对于结构元素而言比较小的孔洞)及在图像边缘出现的小凹陷部分,有对图像外部滤波的作用;而腐蚀可以消除图像中小的成分,有对图像内部滤波的作用,并将图像缩小。先腐蚀后膨胀的过程开运算,具有消除细小物体,在纤细处分离物体和平滑较大物体边界的作用;先膨胀后腐蚀的过程闭运算,具有填充物体内细小孔洞,连接临近物体和平滑边界的作用。(2)灰度数学形态学
Serra和Sternberg等把二值形态算子推广到灰度图像,灰度数学形态学是二值数学形态
A相对结构元素
4页 共21A相对结构元素B
A表示输入图像,BB的所有点平移b(b-b后的交集。它们的 (2-1) (2-2) 如用平移 第页
盐城师范学院毕业论文(设计)
学对灰度图象的自然扩展。Sternberg对灰度形态学的算法及应用进行了综合的阐述,也对灰度形态学的算法及应用进行了较全面的介绍。
二值形态学与灰度形态学是建立在经典的Minkowsk结构和差运算基础上的,又称标准形态学。Minkowsk和差运算是一种集合的逻辑运算,从信号处理的角度来看,形态和差实质上是一种极值滤波,因此是一种非线性的滤波方法。
由于现实中的图像大多为灰度图像,必须将二值形态学扩展到灰度形态学,以有效地处理多值图像。灰度形态学的运算对象不是集合,而是图像函数。从几何意义上讲,灰度膨胀是将结构元素的原点平移到与信号重合,然后计算信号上每一点处对应结构元素的最大值;而灰度腐蚀是将结构元素紧贴在信号下方“滑动”别记为:fg,f⊙g。对灰度图像的膨胀(或腐蚀)操作有两种效果为正的,则输出图像会比输入图像亮(或暗)以及它们的形状相对于结构元素的关系,它们在运算中被消减或被除掉。灰度形态学中的开闭运算都可以用来提取特征或平滑图像。灰度图像的开运算可以去掉图像上与结构函数的形态不相吻合的凸结构,同时保留那些相吻合的凸结构;而闭运算则会填充那些图像上与结构函数不相吻合的凹结构,同时保留那些相吻合的凹结构。(3)模糊数学形态学Sinha和Dougherty于在模糊数学形态学的方法中,图象不再看成是硬二值化集合,而是模糊集合。集合的交、并运算分别由凸的交、并运算代替,从而分别形成模糊腐蚀和模糊膨胀。模糊形态学通过模糊隶属函数表示结构元素与图象之间的适应程度,使滤波效果更加“平滑”(4)软数学形态学
Koskinen等提出了软数学形态学,用排序加权统计方法代替最大、最小法。权值与结构元素有关,并由核心和软边界两大部分组成。软数学形态学具有硬数学形态学相似的代数特性,但具有更强的抗噪声干扰的能力,对加性噪声及微小形状变化不敏感。(5)模糊软数学形态学GaStemtos等将模糊集合理论应用到软数学形态学,数学形态学将模糊数学形态学和软数学形态学结合起来,继承了模糊数学形态学与软数学形态学的特征,可根据图像的拓扑结构,合理选择模糊集合运算算子及结构元素核心、软边界的定义域,并通过改变反映结构元素与图像间匹配程度的参数值调整图像处理的输出结果。
(6)形态小波
;根据输入图像中暗(或亮)细节的灰度值90年代初将模糊数学引入数学形态学领域,形成模糊数学形态学。
第5页 共,其原点刻画出的轨迹。它们分提出了模糊软数学形态学。21页
:如果结构元素的值都
。
模糊软
盐城师范学院毕业论文(设计)
Goustias提出的形态小波是一种非线性的多分辨率分析方法,兼顾了数学形态学与小波变换的优点,具有更好的多分辨率分析特性和更好的抗噪声性能。
2.3 数学形态学的基本运算
数学形态法中最基本的运算是腐蚀和膨胀。腐蚀和膨胀的定义是和集合及集合的运算密切相关的,下面首先介绍数学形态学的基本概念和运算。
设Ω为二值欧几里德空间,图像A是Ω的一个子集,结构元素B也是Ω的一个子集,b∈Ω是欧氏空间的一个点,定义如下两个概念。
平移:Ab定义为图像A被b平移后的结果,表示为:Ab={ a+b|a∈A} Ab中所有元素是A中的对应元素平移元素到以反射:A定义为图像A对于图像原点反射的结果,意即:A={ - a|a∈A} 根据上述两个概念,可以定义数学形态学中的两个基本运算:膨胀和腐蚀。膨胀(dilation)的运算定义式为:腐蚀(erosion)的运算定义式为:图像A被结构元素B膨胀,膨胀后A被结构元素B腐蚀,腐蚀的结果与结构元素的选取有关。因此,选取不同的结构元素同样是膨胀或腐蚀运算,最后所得的结果可能截然不同。在定义膨胀和腐蚀运算的基础上,可以定义数学形态学的两个常用运算:开运算和闭运算。
开运算(opening):A对B的开,即被进行开运算的结果定义为:AB=(A⊙B)B 即A先被B腐蚀,再被B膨胀的结果。闭运算(clothing):A对B的闭运算定义为:A·B=( AB) ⊙B 闭运算的过程正好与开运算的相反,闭运算的特点,通常可以利用开运算删除图像的小分支,利用闭运算填补图像中的空穴。数学形态学的基本运算满足于一些重要的数学条件,此给出最基本的性质:性质1:膨胀和腐蚀运算具有不变性,满足以下条件:
b为原点的坐标系内的结果。
AB={ a+b|a∈A,b∈B} A⊙B={ z∈Ω|BzA} A形状与结构元素B的形状有很大关系。同样,图像
先被B膨胀,后其结果再被
第6页 共21页
B腐蚀。根据开运算和(2-3) (2-4) (2-5) (2-6) B,(2-7) (2-8)
盐城师范学院毕业论文(设计)
( ApB) =( AB)p (2-9) ( Ap⊙B) =( A⊙B)p (2-10) 这说明对图像A进行腐蚀和膨胀的运算结果只取决于A与B的结构,而与A的位置无关。 性质2:对开运算和闭运算,满足下列条件:
( AB) A ( A·B) (2-11) 这个性质说明开运算可以使图像缩小,闭运算可以使原图像增大。
2.4 数学形态学的优点数学形态学作为一种非线性滤波方法,与其它方法相比有以下优点:(1)良好的抗噪保边性。原始图像含有大量加性和非加性噪声,线性滤波基于频域分割原理,在平滑噪声的同时会模糊诸如边缘等图像的细节。形态学滤波是一种非线性滤波,它在去除图像中各类噪声的同时又保持了物体边缘的清晰。(2)图像处理的局部性。形态变换是对图像的局部变换,即运算只和某点邻域内的信息有关而与整体信息无关,这样就大大压缩了信息量,并且可以通过直接调整结构元素的形状来调整图像的处理结果,为图像的实时预处理提供了一个有效的途径。(3)处理并行性。移与逻辑运算的组合来完成,因此便于并行处理和硬件实现,而且它算法灵活,运行速度快捷。
3 预处理及边缘提取在车牌图像信号的采集、输入过程中由于受到自然环境的影响,总会使图像的质量下降。因此需要给车牌图像进行必要的预处理,提高图像质量并突出我们所需要的信息,从而有利于进行各种后续的处理。有的地方还把车牌识别分为预处理、车牌定位、字符分割和字符识别四个组成部分,3.1 图像灰度化实验中所搜集的汽车图像是通过摄像机、数码相机等设备拍摄获取的,因而预处理前的图像都是彩色图像。彩色图像又称素的颜色,色。彩色图像包含着大量的颜色信息,不但在存储上开销很大,而且在处理上也会降低系
数学形态学的最大特点就是将大量复杂的图像处理转换成最基本的平
由此可见图像预处理在车牌定位、
R、G、B分别代表红、绿、蓝RGB图像4,它是利用3种不同的颜色,通过三基色可以合成出任意颜7页 共21页
识别中占有十分重要的地位。
R、G、B3个分量表示一个像
第盐城师范学院毕业论文(设计)
统的执行速度。由于图像的每个像素都具有三个不同的颜色分量,存在许多与识别无关的信息,不便于进一步的识别工作,因此在对图像进行识别等处理中经常将彩色图像转变为灰度图像,以加快处理速度。
图3.1 汽车原图(0×360)
将彩色图像转化为灰度图像的过程称为图像的灰度化处理[8]。灰度图(GrayScale)是指只包含亮度信息,不包含色彩信息的图像,例如平时看到的亮度由暗到明连续变化的黑白照片。要表示灰度图,就需要把亮度值量化,通常分成0~255共256个级别,0最暗(全黑),255最亮(全白)。由于256级灰度比较简单,若是彩色图像,其颜色种类较多,不利于图像处理,因此一般都是将彩色图像转换为灰度图进行处理。
一般拍摄到的图像均为24位真彩色图像,图像数据中的每一个像素值由红色(R),绿色(G)和蓝色(B)三个分量组成。为便于后面的定位操作和提高处理速度,需要对原始图像进行灰度化处理,将每点的分量转换成灰度信息。常用的灰度化方法有以下三种:
第一种:求出每个像素点的R、G、B的平均值,然后把这个平均值赋给该像素点的R、G、B三个分量。
第二种:求出锥个像素点的R、G、B三个分量的最大值,然后把这个最大值赋给该像素点的R、G、B三个分量。
第三种:根掘YUV的颜色空间,Y分量的物理意义就是亮度,包含了灰度图的所有信息,只用Y分量就完全能够表示出一幅灰度图来。转换公式为:
Y=0.3R+0.59G+0.11B (3-1)
第8页 共21页
盐城师范学院毕业论文(设计)
第一种方法得到的灰度图常常会偏亮。第二种方法得到的图像比较平滑,但损失了原图像的一些细节。笫三种方法公式中三分量前的系数为经验加权系数,加权系数的取值建立在人眼的视觉模型之上,对于人眼较为敏感的绿色取较大的权值,对人眼较为不敏感的蓝色取较小的权值,通过该公式转换的灰度图能够较好地反映原图像的亮度信息。本文所用图片为0×360 像素的真彩图像,采用第三种方法对彩色车牌图像进行灰度化。灰度化处理的公式如下:
Gray=0.299*R+0.587*G+0.114*B (3-2) 车牌图像进行灰度化后的图像如图3.2所示。
图3.2 灰度化后的汽车牌照
3.2 图像二值化
二值图像是指整幅图像画面内仅有黑、白二值的图像,在它们之间不存在其他灰度层次的变化。在数字图像处理中,二值图像占有非常重要的地位。这是因为,一方面,有些需要处理的图像,如文字图像、指纹图像、工程图纸等图像本身是二值的;另一方面,在某些情况下,即使图像本身是有灰度的,我们也设法使它变成二值图像再进行处理(即灰度图像的二值化6)。
图像二值化也叫阈值处理,就是对于输入图像的各像素,灰度值在某定值(称为阈值,threshold)范围内时,赋予对应输出图像的像素为白色(High=255)或黑色(Low=0)。通过上述的阈值处理后,得到只有两个灰度值的二值图像(binary image)。所以一般也被称
第9页 共21页
盐城师范学院毕业论文(设计)
作二值化处理(binarization)。在数字图像处理中,二值图像占有非常重要的地位。在实用的图像处理系统中要求处理得速度快、成本低,二值图像具有这一优点。此外,二值化后的图像能够用几何学中的概念进行分析和特征描述,具有很大的优势。
图像二值化的关键在于阈值T的设定,过小的阈值会把不需要的内容(例如背景)也一起提取出来,相反,过大的阈值会去掉部分目标物体。根据阈值T来区分图像中的对象和背景。设原始灰度图像为f(x,y),变换后的二值图像为g(x,y),则二值化的过程表示为:
1,f(x,y)tg(x,y)=0,f(x,y)3.2.1 常用的二值化方法车牌图像二值化的关键是阈值的选择。车牌二值化的方法一般分为三类,即全局阈值法、局部阈值法和动态阈值法。(1)全局阈值法
全局阈值法根据图像的直方图或灰度空间分布确定一个固定阈值好的图像较为有效,特别是对具有双峰直方图的图像对应于图像的目标)而言。布不呈双峰的图像,二值化效果明显变差。典型的全局阈值方法包括法等。
(2)局部阈值法
局部阈值法通过定义考察点的邻阈,并由邻阈计算模块实现考察点灰度与邻阈点的比较,此法能适应较为复杂的情况,但它时间开销大,而且在某些情况下会产生一些失真。Bernsen算法是一种典型的局部阈值法。(3)动态阈值法
动态阈值法是一种自适应的二值化方法,它的阈值不仅取决于该像素灰值及它邻域内像素的灰值,而且还和此像素的坐标位置有关。3.2.2 二值化处理图像的特点(1)对车牌进行二值化处理时,当阈值在一定的范围内变动时,车牌轮廓都能从背景中分离出来,只是分离的质量有时好有时差。(2)选取的比较合理,车牌的轮廓从背景中比较清晰的分离出来时,车牌的区域就比较好确定。
(3)车牌分离的质量往往在二值化变动范围的中部达到最佳。3.3 边缘检测
t
但其对于那些由于光照不均匀、
(一个峰对应图像中的背景,噪声干扰较大等原因使直方图分
10页 共21页
(3-3)
T,此法对于质量较另一个峰Otsu方法、最大熵方
第盐城师范学院毕业论文(设计)
图像的边缘是图像的最基本特征。所谓边缘是指其周围像素灰度有阶跃变化或屋顶变化的那些像素的集合,是图像中灰度发生急剧变化的区域。图像灰度的变化可以用图像的梯度反映。
我国车牌的底牌与字符的颜色主要有蓝底白字、黄底黑字、黑底白字和白底黑字4种,虽然颜色不统一,但有个共同的特点是底色与字符和边框的颜色反差较大,这一特点有利于边缘检测,因此可以利用边缘检测算子对灰度图像进行预处理。常用的边缘检测算子有robert算子、sobel算子、prewitt算子、log算子和canny算子。
边缘检测就是连续图像f(x,y)梯度的局部最大值和方向。 f(x,y)沿r的梯度:
fr=fxxr+fyyr=fxcos+ fysin f使f最大的条件是rr=0 梯度最大值及其方向由(3-4)、(3-5)式求得:
fxcos-fysin=0 1=tanfyf或+π x梯度最大值=
f2xf2y 在离散情况下常用梯度算子来检测边缘,给定图像f(m,n)在两个方向1(m,n)和2(m,n)如下:
1(m,n)=f(m,n)* H1(m,n) 2(m,n)= f(m,n)* H2(m,n) 则边缘的强度和方向由下式给出:
(m,n)=221(m,n)2(m,n) ,n)(m,n)= tan12(mm,n) 1(Roberts边缘算子:=
f2xf2yfx+fy
=f(i,j)f(i1,j1)+f(i1,j)f(i,j其卷积模板分别是:
第11页 共21页
H1和H2 ) (3-4) (3-5) (3-6)
(3-7) (3-8)
(3-9) (3-10)
(3-11) (3-12)
(3-13) 上的梯度
1 盐城师范学院毕业论文(设计)
-0 11 0H1= H2=0 - 1 (3-14) - 1 0 Roberts算子特点是边缘定位准,但对噪声敏感。 Sobel边缘算子的模板是2个3×3 的卷积核:
- 1 0 1- 1 - 2 - 1 H= 0 0 0 (3-15) - 2 0 2H1=2 1 2 1- 1 0 1其中,H1对垂直边缘响应最大,而H2对水平边缘响应最大。
图像中每个点都用这两个核做卷积运算,其中一个核对垂直边缘响应最大,而另一个核对水平边缘响应最大,以两个卷积的最大值作为该点的输出值,运算结果是一幅边缘幅度图像。它是有方向性的,在水平和垂直方向上形成了最强烈的边缘,即sobel算子对水平边缘和垂直边缘响应最大,而且对灰度渐变和噪声较多的图像处理较好,考虑实际处理情况, 这里用sobel算子完成边缘检测的工作。
车牌图像进行二值化及边缘检测后的图像如图3.3所示。
图3.3 二值化及边缘检测后的汽车牌照
4 车牌定位
经过实践摸索,本文设计了一种先利用数学形态算根据车牌整体特点进行粗定位,然后根据字符边缘特征进行精确定位的车牌定位方法,该方法是基于灰度图像的。经
第12页 共21页
盐城师范学院毕业论文(设计)
过对大量车牌图像的分析,可以发现,车牌特征可以分为宏观整体特征和微观纹理特征。前者例如车牌区域基本呈矩形或平行四边形,且长高比变化有一定范围。后者例如车牌区域内呈规则的纵向纹理变化。
4.1 车牌类型规格及特点
利用车牌的某个或某几个特征一般总能把车牌从车牌图像中分离出来,不过并不一定能得到精确的车牌位置。而且世界各国的车牌千差万别,各不相同,大多数研究都是针对某一种或某一地区车牌的,本文也只针对我国车辆牌照(1)我国车牌类型
中华人民共和国公共安全行业标准对机动车号牌的分类、规格、颜色、适用范围有明确的规定。可分为六大类:
①小型汽车所用蓝底白字号牌;②大型汽车所用的黄底黑字号牌;③军用或警用的白底黑字、红字号牌;④国外驻华机构所用的黑底白字号牌;⑤摩托车号牌;
⑥农用运输车、拖拉机号牌。(2)车牌特征
车牌定位的算法很多,不过大都考虑了牌照区域的特点,所以首先要了解一下车牌区域的特征,其大体可分为以下几类:①车牌的几何特征:车牌为矩形,宽、高比例在一定范围内,约在②车牌形状及字符格式特征:车牌有矩形边框,字符位于矩形框中且有一定间隔。③车牌区域的纹理特征:车牌区具有排列基本均匀的字符,在图像上表现为一定的纹理特征。
④车牌区域内灰度直方图统计特征:具有两个明显且分离的分布中心。⑤车牌区域的灰度分布特征:穿过车牌的水平直线其灰度呈现连续的峰、谷、峰的分布;车牌的底色、边缘颜色以及车牌外的颜色都是各不相同的,表现在图像中就是灰度级互不相同。车牌的边缘在灰度上的表现是一种屋顶状边缘。在车牌区域内部,字符和车牌底的灰度呈现较均匀的波峰和波谷分布。⑥车牌区域图像的水平(垂直)投影特征:车牌区域水平或垂直投影呈现连续的峰、谷、峰的分布。
13页 共21页9进行识别研究例。
3.0~3.2之间;
第
盐城师范学院毕业论文(设计)
⑦频谱特征:对图像作行或列的DFT变换,其频谱图中包含了车牌的位置信息。 (3)我国车牌特征
我国车牌与国外大多数国家相比,除了具有车牌的一般特征外,还有它的特殊性,主要表现在以下几个方面:
①我国标准汽车牌照是由汉字(包括省级简称、天干、地支以及“警”字)、英文字母和阿拉伯数字组成。标准的车牌(军车,警车,教练车,外交车除外)上有七个字符,字符样式为x1x2x3x4x5x6x7。它们基本呈水平排列,在矩形内部存在较丰富的边缘。
②国外许多国家汽车牌照的底色和字符颜色通常只有对比度较强的两种颜色,而我国汽车牌照仅底色就有蓝、黄、白、黑等多种颜色,字符颜色也有黑、红、白等若干种颜色。现有的车牌底色和字符颜色搭配有四种类型:小功率汽车为蓝底白字车牌,大功率汽车为黄底黑字车牌,军警用的是白底黑字车牌,国外驻华使馆用的是黑底白字车牌。③其他国家的汽车牌照格式(如汽车牌照的尺寸大小,牌照上字符的排列等)通常只有一种,而我国则根据不同车辆、车型、用途,规定了多种牌照格式如分为军警用车、普通车等。车牌的边缘是线段围成的有规则的矩形,大小变化有一定的范围。④我国汽车牌照的规定悬挂位置不唯一。⑤车牌受到严重污染的车辆,(4)①含有丰富的自然背景信息,同时易受照明、天气条件及运动失真和模糊的影响;②由于在野外环境下使用,车牌会有不同程度的磨损、污迹干扰、变形。这些问题给车牌定位带来了难度。4.2 基于数学形态学的车牌粗定位本文第二章已经介绍了数学形态学的基本概念和运算本运算中最基本的运算:图像膨胀和腐蚀。对于车牌图像的处理,首先要对拍摄距离和车牌图像占总图片的比例作出一定的,然后根据经验值设置结构元素的大小。由于车牌图片横向间隔较大,先对车牌图像进行横向膨胀使颜色对特征点相互连通;然后再用同样的结构元素对膨胀后的图片进行腐蚀,去除孤立的干扰点,长方形结构元素对车牌图片进行闭运算。腐蚀实际上是一种消除目标图像所有边界点以及边界上突出部分的过程;它可以从图像上去除一些小且无意义的目标;膨胀可以连接图像中的断续点和填补图像中的空洞;开
也就是形态学中的闭运算。
针对本文所进行的试验,
14页 共21页[1,2,3],以下主要介绍一下四种基
11×3 的
在我国仍可上路行驶,这种情况国外发达国家并不多见。车牌定位中存在的问题 选取第
盐城师范学院毕业论文(设计)
运算可以消除边缘突起而使图像边界平滑;闭运算可以添充图像内部空隙并连接邻近物体。在图像处理中可以通过开运算和闭运算消除噪声,恢复图像。而有效运用数学形态法的关键在于根据应用特点选取合适的结构元素对图像进行操作。
基于数学形态学的车牌区域粗定位,主要是根据车牌整体特征从水平方向初步确定车牌位置,它不能精确确定车牌左右边界的位置,所以必须辅以其余的定位方法进行精定位。而基于字符边缘特征的车牌区域精定位,可以利用车牌微观特征进一步从纵向上精确确定车牌位置。所以,这两种定位方法常常结合来使用。 4.2.1 图像腐蚀
在第二章中介绍了腐蚀(erosion)的运算定义式为:利用结构元素g(x)对信号f(x)的腐蚀定义为:(f⊙g)(x)=max{y:g(x)+y< 为了便于使用,我们利用g的定义写出其等价形式:f⊙g={fx+g(x):xD(g)} 根据这一形式,腐蚀可以按下面的步骤完成: 第15页A⊙B={ z∈Ω x腐蚀的结果,我们在空间滑动这个结构g} (Minkowski)差的全局定义形式: g(-x),然后再对 共21页 |BzA} x点重合,然后 g(-x) (4-1) (4-2) (4-3) (4-4) 进行横轴 盐城师范学院毕业论文(设计) (1)对结构元素g的定义域D(g)中的每一个点x,将信号f平移x。 (2)然后,再从每次平移信号值中减去g(x)。这样,对于结构元素定义域中的每一点都得到一个信号。 (3)对新得到的信号逐点取其最小值,这样便可以得到腐蚀结果。 图像膨胀在一定程度上增大了车牌字符的面积,为了还原车牌真实大小以及消除车牌候选区域毛刺,根据膨胀和腐蚀的对偶性,我们对图像进行水平垂直结构元素腐蚀,结果如图4.1所示。 图4.1 腐蚀后的汽车牌照图像 4.2.2 图像膨胀 在第二章中介绍了膨胀(dilation)的运算,定义式为:AB={ a+b|a∈A, b∈B}。 在图像预处理步骤中,我们对车牌进行一定处理并取得较好的效果,但由于一些客观因素,车牌边框和铆钉有时会残留一些较小的边缘信息,这时,如果采用钻石形(diamond)、圆盘形(disk)或方形(square)等结构元素膨胀时就会把这些边缘信息纳入车牌字符内,不利于后继处理,而水平垂直结构元素的方法有效避免了此种不利情况。水平垂直结构元素在数学形态算具有一定的优点,并有利于后面工作。图4.2是对图4.1进行水平垂直结构元素膨胀的结果。 膨胀运算在数学形态学中所起的主要作用是把图像周围的点并进图像中,如果两个图像之间的距离比较小,那么在经过膨胀运算处理后,完全有可能将其连通。由此可见,膨胀运算在连接图像中的断续点和填补图像中的空洞是非常有用的。 第16页 共21页 盐城师范学院毕业论文(设计) 膨胀除了上述的定义形式外,还有明克夫斯基和的全局定义形式: fg={fx+g(x):xD(g)} (4-5) 根据这一形式,膨胀可以按下面的步骤完成: (1)对结构元素g的定义域D(g)中的每一个点x,将信号f平移x。 (2)然后,再从每次平移信号值中加上g(x)。这样,对于结构元素定义域中的每一点都得到一个信号。 (3)对新得到的信号逐点取其最大值,这样便可以得到膨胀结果,如图4.2所示。 图4.2 膨胀后的汽车牌照图像 4.3 车牌上下边界的确定 图像积分投影定义:给定N×N图像I(x,y),分别定义水平投影函H(y)和垂直投影函数V(x),图像区域为(x1 (4-6) (4-7) 盐城师范学院毕业论文(设计) 4.3(a)水平方向投影 4.3(b)垂直方向投影 4.3投影图 由于车牌一般位于图片的偏下的位置,采用对预处理的图像从下往上扫描的方法,当水平扫描线的投影值大于一定的阈值才认为是连续的,这样可以排除不连续的区域投影所带来的影响。当连续的矩形区域内像素个数小于一定的范围并且区域高度小于车牌的最小高度,表明所扫描的区域内不存在车牌。此时为减少扫描的次数,以一定的增量向上移动扫描起点,重复直到所扫描的区域内像素的个数满足一定的阈值,标记此区域为候选区域。通过对候选区域进行车牌左右边界定位,如果满足条件表明找到候选车牌区域,重复前述对所有的候选区域进行判断。车牌图像水平方向定位的结果如图4.4所示。 图4.4 水平定位后的汽车牌照图像 4.4 车牌精确定位 在得到的是一个基本端正的车牌区域图片后,为了字符分割时少一些干扰,这一步去除车牌多余的边缘部分,对车牌进行精确定位。 车牌位置一般在车牌图像的中下方,应此在扫描图像时应从下往上,从左往右。车牌具有固定的长宽比,车牌字符的长宽比也在一定范围内,在统计颜色对特征点时可根据此特征先从边缘检测去除车牌边框;车牌共有7个字符,其中第一个是汉字,其余六个是字母和数字,由于字母和数字都是连通的,所以每行的颜色对特征点数最少12个;字符与字符之间有一定的距离,而且前两个字符与后五个字符间的距离较大。 (1) 确定车牌上下边界。从上至下进行逐行扫描,并记录每一行的特征对点数,一般车牌中包含7个字符,每个字符至少会出现2个特征对点,考虑到汉字的结构,可以假设特征对点数最小个数的阈值为12,即特征对点数小于12的行不属于车牌区域,由此可以 第18页 共21页 盐城师范学院毕业论文(设计) 确定车牌的上下边界。 (2) 确定车牌左右边界,这里可以使用垂直投影法。7个字符中间共有6个分割区域,其间的特征对点数很少,其中第二个和第三个字符之间的间隙比其余5个要大一些。 (3) 如图4.4,在第一步中会得到两个车牌区域,由上下边界和左右边界可以得到车牌长宽比,再与车牌标准长宽比进行比较滤除伪车牌区域。注意在黑白颜色对特征点空间中,车牌的前2个字符是红色,所以确定其左右边界及比较长宽比时要特殊对待。 至此,车牌定位工作完成,得到的是一个只包含车牌字符的车牌区域,如图4.5所示。 图4.5 精确定位出汽车牌照 4.5 多种环境下不同精确定位结果 以下是一组由本人在盐城师范学院校园中于不同时间、不同光照条件下拍摄的不同汽车牌照图片,并按照本文所用方法分别进行汽车牌照的精确定位,从结果来看定位效果比较理想。 图4.6(a)傍晚主楼门口所拍摄汽车牌照 图4.7(a)阳光下所拍摄校车牌照 图4.6(b)傍晚主楼门口所拍摄汽车牌照灰度化 图4.7(b)阳光下所拍摄校车牌照灰度化 第19页 共21页 盐城师范学院毕业论文(设计) 图4.6(c)傍晚主楼门口所拍摄汽车牌照定位结果 图4.7(c)阳光下所拍摄校车牌照定位结果 5 小结 本文对采集的70幅车牌图像进行处理,有效定位成功65幅,由于白底黑字车牌为军用及警用,没有对其进行采集。 失败的原因主要是图像的模糊、污染使得颜色特征点的提取中一部分特征点丢失,进而导致其纹理特征失常;车牌倾斜角度过大,在颜色对特征点的提取中,对像素点的颜色识别方法还需改进;步进幅度的系数还需要大量的实验来进行校正;车牌旋转算法需要修正,改善旋转后字符超出边界问题。 由于车牌背景的复杂性和车牌特征的多样性,使得目前大多数车牌定位方法的通用性和实用性不足。而在车牌识别中车牌定位的准确度直接影响了识别的效果,因此,车牌定位仍有很多工作需要做。 [1]卢雅琴,邻凌超.基于数学形态学的车牌定位方法[2]李波,曾致远,付祥胜.基于数学形态学和边缘特征的车牌定位算法2005(7):94-96 [3]杨国来,林男,姬孝斌等. 科学学报,2007,19(1):114-117 [4]任仙怡,周晓.彩色汽车牌照定位方法[5]龚声蓉,刘纯平,王强.数字图像处理与分析[6]吴传孙,邹扬德,周定康.2003(6):13-16 [7]张智星.MATLAB程序设计与应用[8]章毓晋.图像工程(上册)—图象处理与分析[9]刘智勇,刘迎健.车牌识2001(14):29-34 导致在旋转后字符超出图像边界,参考文献 .计算机工程,.红外与激光工程,.北京:清华大学出版社,.北京:清华大学出版社,.北京清华大学出版社,(LPR)中的图像提取20页 共21页 字符丢失。2005.2(3) .电视技术,.甘肃2002.6:204-206 2006.7 2002.4 2000 分割.中文信息学报,在车牌区域扩张的过程中,基于数学形态学和综合颜色特征的车牌定位方法二值化算法在车牌识别中的应用,计算机与现代化,别及第盐城师范学院毕业论文(设计) Based on mathematical morphology of the license plate location algorithm Abstract The automatic identification technique for license plate location is an important technique in the intelligent transport system ( ITS) , while the license plate location is one of the key points of the license plate identification. Aiming at the vehicle license plate recognition system, this text proposed a method based on mathematical morphology. This process was divided into image preprocessing, edge extraction, license plate rough location and license plate precise location, which is implemented separated by using MATLAB, the license is located at last. At the same time, the problems are also analyzed and solved in the process. The best location method of recognition to the very vehicle license is found. After applying the algorithm to hundreds of images of vehicle taken in plenty of situations,our result indicates that the algorithm has a reliable, fast, robust performance and it can locate the license availably. Keywords: image processing, license plate, mathematical morphology, license plate location 第21页 共21页 因篇幅问题不能全部显示,请点此查看更多更全内容
Copyright © 2019- oldu.cn 版权所有 浙ICP备2024123271号-1
违法及侵权请联系:TEL:199 1889 7713 E-MAIL:2724546146@qq.com
本站由北京市万商天勤律师事务所王兴未律师提供法律服务