您的当前位置:首页基于分块主颜色的图像检索方法研究与实现

基于分块主颜色的图像检索方法研究与实现

2020-10-03 来源:小侦探旅游网
维普资讯 http://www.cqvip.com

2006年第30撂 中国石油大学学报(自然科学版) Vo1.3()No.2 第2期 Joureal of China University of Petroleum Apr.2006 文章编号:1673—5005(2006)02.0143.04 基丁分块主颜色的图像检索方法研究与实现 郑秋梅 ,晁永胜 ,任平红2,孙绪华 (1 中国石油大学计算机与通信工程学院,山东东营257061;2.曲阜师范大学计算机科学学院,山东曲阜276826) 摘要:颜色直方图法是基于内容的图像检索系统通常采用的方法。提出了一种基于分块主颜色的检索方法,克服了 颜色直方图无法表达颜色空间分布信息的缺陷,将简化的二次式距离计算方法应用到分块主颜色的匹配中,降低了 算法复杂度,提高了计算效率和对图像相似度判断的准确率,从而提高了图像检索的效率。据此实现的图像检索系 统的运行结果表明,该方法的查准率和查全率比颜色直方图法有明显提高。 关键词:图像检索;颜色直方图;分块主颜色 中图分类号:TP 391.4 文献标识码:A Research and implementation of image retrieval system based on dominant color of partition ZHENG Qiu—mei ,CHAO Yong—sheng ,REN Ping—hung ̄,SUN Xu hua。 (1.Coil ・/’C ̄)mputer and( ̄mmunication Engineering in(J ̄ina University Petroleum,  ̄mgying 257061,Shandong Province,China; 2.GdlegP oj(. ̄'mtputel &ience Engineering,Q“ Normal University,Qujh 276826,Shandong Province,China) Abstract:Color histogram is the nqo ̄[usually used method of content—based image retrieva1.In order tO∞lve the problem of lacking the spatial knowledgc of color histogram.an approach of image retrieval based on dominant color of partition was presented.Meanwhile,reduced quadratic fonTl distance method was applied tO decrease arithmetic complexity.which irn— proves computational efficiency and precision to measure similarity of image ̄;.Thus the retrieval efficiency increases.Exper— imental results of the image retrieval system implemented based on this approach show that precision and recall are impmved apparently compared tU these of color histogram. Key words:image retrieval;color histogram;dominant color of partition 近年来,在数据库系统和讨‘算机视觉两大领域 效果。为此,笔者提出一种基于分块主颜色的图像 快速发展的推动下,基于内容的图像检索技术 检索方法,以提高查准率和查全率。 (CBIR)已成为非常活跃的研究领域。CBIR是指将 自动提取的图像视觉内容特征作为索引进行检索, 1基于分块主颜色的图像检索系统 其关键技术是图像内容特征(颜色、纹理、形状等)的 基于分块主颜色的图像检索的基本思想是:将 提取和匹配。颜色特征是图像的重要视觉内容,它 图像分成固定的块数,以各块的主颜色计算对应块 不仅具有旋转不变性和尺寸不变性,而且比其他特 之间的距离,将各对应块之间的距离加权求和得到 {LE更容易获取,因此经常被采用。以颜色为特征的 两幅图像之间的距离。由于全局颜色直方图检索没 CBIR,通常采用全局颜色直方图法,但这一方法没 有考虑到颜色的空间分布信息,会把外观上根本不 有考虑颜色的空间分布信息,而这一信息极大地影 相似的图像作为相似的图像。而基于分块主颜色的 响着图像的相似性判断…1,严萤制约着图像检索的 检索方法是在颜色特征的基础上通过分块引入了图 收稿日期:2005 08 20 作者简介:郑秋梅(1964…),女(汉族),山东高密人,教授,硕士,从事图形图像处理方面的研究。 维普资讯 http://www.cqvip.com

・144・ 中国石油大学学报(自然科学版) 2006年4月 像颜色的空间分布信息,不同的图像如果在空间相 近的位置同时存在相似的颜色区域,则这两幅图像 具有较大的相似度ll J。因此,通常情况下,分块主 颜色的检索结果更符合人眼的视觉特征。 1.1颜色模型 f1,s∈[0.2,0.7], S=<2,s∈[0.7,1], 【0,S∈【0,0.2 l, f1, ∈[0.2,0.7], V: 2, ∈[0.7,1], l0,S∈[0,0.2], 常用的面向视觉感知的颜色模型是HSV颜色 模型。它的3个分量H,S,V分别对应于彩色信号 的色调、饱和度和亮度,可用三维空间坐标表示。由 再按G=9H+3S+V转化成一维特征向量。 通过以上步骤把颜色特征量化到0~7l之间的 于HSV模型不仅具有坐标之间的心理感知独立性, 而且具有线性伸缩性,可感知的颜色差与颜色分量 值的欧几里德距离成比例,因此HSV模型更适合于 用户的肉眼判断l2 j。基于分块主颜色的图像检索 系统可直接用RGB颜色模型来提取图像的颜色特 征,然后转化到HSV模型中。 设,.,g,b∈[0,1,…,255],由RGB颜色模型 到HSV颜色模型的转化如下: =max(,.,g,b), _mln ,.0, ’ , , g ,一 型二g ’ , 一.b 自一 _r ’ = /255. ∈『0.1]. 一 : , ,,  ∈[ l0,U,L1], l, (5+b ),,.=max且g=min, (1一g ),,.=max且g≠min, h = (1+r ),g=max且b=min, (3一b ),g=max且6≠min, (3+g ),b--nmax且,.:min, (5一,. ),其他. h=60×h . 1.2颜色特征的表达 最常用的颜色特征的表达是颜色直方图。由于 真彩色的颜色直方图数据量太大,因此一般通过转 化和量化,构造一维特征向量来简化颜色特征[4l。 常用的颜色特征的量化如下所示: 0,h∈[316,20], 1,h∈[21,40], 2,h∈[41,75], H= 3,h∈[76,155], 4,h∈[156,190], 5,,2∈[191,270], 6,h∈[271,295], 7,h∈[296,315], 整数值,最后计算整幅图像的颜色特征值,可以得到 72柄的一维直方图,此直方图是对图像进行匹配的 依据。 1.3分块主颜色的匹配 图像颜色特征的匹配方法可以分为两类:非相 似性匹配和相似性匹配。非相似性匹配是指仅以两 枚图像的颜色直方图作为匹配参数;相似性匹配指 不仅考虑两枚图像的颜色特征,而且也考虑两种颜 色之间的距离。 一般来说,相似性匹配方法比非相似匹配方法 的检索效果好,但算法复杂度高。其中,被广泛采用 的二次式距离法已被证明比欧拉距离和直方图相交 法更有效,原因在于这种方法考虑到了不同颜色的 相似度 3。二次式距离D的计算公式如下: D=(P—Q) A(P—Q). (1) 式中,P和Q分别为两枚图像的颜色直方图信息; A为颜色相似性矩阵,A:[a ]是指颜色直方图下 标为 ,J的两种颜色之间的距离。J R Smith首先 提出了一种常用的颜色距离计算公式_55,_引入了颜 色相似短阵 一A,但是A的计算量太大。实际应用中 利用简化的计算方法,即 aij=2一 l,1. (2) 此简化方法明显提高了A的计算效率,但没有 考虑颜色空间分布信息。而通过分块,可将这一信 息引入。因此把这一简化方法与分块主颜色的匹配 方法相结合,既通过简化的二次式距离计算降低算 法复杂度,提高计算效率,又通过分块引入颜色的空 间分布信息,提高对图像相似度判断的准确率,从而 提高图像检索的查准率和查全率。 设有两幅图像P和Q,把图像分成M×N块, 计算图像第i块的主颜色P 、Q ,由式(2)可得Pf 和Q 两种颜色之间的距离为 以脚=2一l Pf . 由式(1)可得图像某一对应块之间的距离为 D=P 十Q 一2PiQiavof. 为了突出图像分块数目的重要性,设置第i块 维普资讯 http://www.cqvip.com

第30卷第2期 郑秋梅,等:基于分块主颜色的图像检索方法研究与实现 ・145・ 的权值为叫,,然后各对应块之问的距离加权求和, 图像之间的距离为 用关系数据库,库中图像的存储主要有存储路径和 存储图像两种方法。存储路径法是把图像存储到文 D(P,Q)---‘∑ (P +Q 一2 一I Q P Q ). 分块数目将直接影响到运算效率和检索效果。 如果分块较少,则占用存储空间小,运算量小,系统 效率高,但分块太少,最少为一块,将退化到基于全 件夹中,数据库中只存储图像的存储路径 存储图 像法是用关系数据库扩展的大二进制(BLOB)字段 把图像的信息存人数据库中。存储路径法的效率较 高,但是由于把图像存储到文件夹中,已使数据库退 化到文件系统,安全问题存在隐患。而存储图像法 局颜色直方图的检索,无法引入颜色空间分布信息, 影响检索效果。如果分块较多,可以更好地引入颜 色的空间分布信息,提高检索效果,但是太过精细的 分块,最多为一个象素划分为一块,也会退化到基于 全局颜色直方图的检索,而且占用存储空间大,计算 量大,系统效率低 在实际应用中,采用折衷方法较 为合理。在本系统中,考虑到图像的大小和运行效 率,分别采用了3×3,5×5,8×8的分块方案。 2 系统实现及关键技术 2.1系统总框图 开发完成了基于颜色特征的图像检索系统,该 系统实现了基于分块主颜色和颜色直方图等方法的 图像检索。系统主要由输入样图、特征提取、特征描 述、检索图像、显示结果、图像管理等模块组成。系 统框架如图1所示。 图1系统框架 2.2 系统功能 系统可以实现基本图像检索的功能,根据用户 输入的样本,得到样本图像的颜色特征,然后与图像 库中的图像颜色特征进行匹配,找出与样本图像距 离比较小的若干图像,按照由小到大的顺序,反映给 用户 其中图像管理可以实现图像的添加、删除、修 改等操作。对图像的操作和对特征的操作同步,添 加图像时,系统自动添加图像的各种特征信息。 2.3图像的存储 CBIR系统需要一个庞大的图像数据库,库中 图像的存储方案直接影响系统的检索效率。图像特 征提取的效率与图像的大小有关,如果图像太大,则 运算量大,效率低。为了提高效率,在图像存人数据 库前,用图像处理工具把图像宽度统一处理为200 个像素。 目前,大多数CBIR系统的图像数据库仍然采 是通过数据流把图像信息直接存到相应的BLOB字 段中,由于图像文件一般比较大,所以反复地存取图 像会大大降低系统的性能,但这种方式安全性较高, 用户可以像管理其他的数据库信息一样,统一地管 理图像信息,数据的完整性能够得到保证。存储图 像法还存在着容量限制的问题,如果图像很大, BLOB字段容量又不够大时,就会出现异常。但在 sQL Server7.0中BLOB字段Image数据类型的字 段长度可以达到2G,已有效地解决了这个问题。本 系统中考虑到图像检索的效率,采用了存储路径法。 2 4图像库的设计 图像库主要包括图像的基本信息表和颜色特征 表。由于图像的特征值是72柄的一维直方图,如果 在颜色特征表中用一个字段表示某个灰度级的频度 值,则需要72个字段,字段过多,存取数据会降低效 率。所以本系统采用字符串表示颜色直方图H信 息,即把H的各个分量用标志隔开,然后转化成字 符串存人数据库。在进行颜色特征匹配时,再转化 回去 3 系统性能评价及改进 通常以查准率和查全率来评价基于内容的图像 检索系统的性能l3,6 J,其定义如下: =R/N. A=R/M. 式中, 为查准率;A为查全率;N为查询返回的图 像数;R为查询结果中与样本图像相关的图像数; M为测试集合中与样本图像相关的图像总数。 将分块主颜色方法和目前最常用的颜色直方图 方法进行对比分析。系统图像数据库中存储了895 幅颜色丰富的花卉图像,其中包含72幅与样本相关 的图像。当检索返回的图像数目分别为N=10, 20,30,40,50,60,70,8【】,9()时,其查准率和查全率 如表1,2所示。可以看出,不同的分块数目对查准 率和查全率的影响不同,在一定范围内的分块数目 较多时,查准率较高,但查全率并不随着分块数目的 增多而提高。分块主颜色的检索效果明显优于颜色 维普资讯 http://www.cqvip.com

・146・ 中国石油大学学报(自然科学版) 2006年4月 直方图的检索方法。 图像颜色信息的同时,又附加了图像在颜色空间中 该方法只考虑了图像对应块之间的距离,若能 的分布情况,因此提高了对图像相似度判断的准确 同时考虑相邻块之间的距离,并且根据目标和背景 率,不仅提高了检索的查准率和查全率,而且使检索 选择不同的权值进行匹配,效果会更好[1l,这有待 结果更符合用户的需求。此方法在互联网搜索引擎 今后进一步改进。 设计、数字图书馆及图像处理等领域,具有较好的应 表1分块主颜色法与颜色直方图法查准率对比 用前景。随着数字化设备与网络的普遍应用,以及 大容量存储设备成本的下降,基于内容的图像检索 技术会有更广阔的发展前景。 参考文献: [1] 何清法,李国杰.综合分块主色和相关反馈技术的图像 检索方法[J].计算机辅助设计和图形学报,2001,13 (10):912—917 HE Qing- ̄,LI Guo-jie.An approach to combining dom— inant cobr 0f partition with relevance feedback in image ertrieval[J].Joumal 0{Computer-Aided Design&Com— 表2分块主颜色法与颜色直方图法查全率对比 puter Graphics,2001,13(10):912—917. [2] 章毓晋.基于内容的视觉信息检索[M].北京:科学出 版社,2003:57.81, [3]茹立云,彭潇,苏中,等.基于内容的图像检索中的特征 性能评价[J].计算机研究与发展,2003,40(11):1 566— 1 570. RU Li—yun,PENG Xiao,SU Zhong,et a1.Feature per・ formance evaluation in content—absed image retrieval[J]. Journal of Computer Research and Devdopment,2003,40 (11):1 566—1 570. [4]曹莉华,柳伟,李国辉.基于多种主色调的图像检索算 法研究与实现[J].计算机研究与发展,1999,36(1): 4结束语 96.100. CAO Li—hua.I IU Wei,LI Guo-hui.Research and im— 基于内容的图像检索是国内外信息检索领域的 plementation of an image retrieval algorithm based on 热点研究课题,广泛应用于军事、信息安全、地理信 multiple dominant colors[J].Journal of Computer Re 息、遥感等领域。目前,互联网搜索引擎(G ̄gle、百 search and Development,1999,36(1):96—100. 度等)的图片搜索多采用关键字索引,存在人工标注 [5]SMITH J R,CHANGSF.Visual seek:afuIly automat— 关键字费时费力、主观性太强的缺陷。本文中提出 de content—based image query system:proceedings of the 的基于分块主颜色的图像检索方法,完全克服了这 Fourth ACM Int’l Multimedia Conf 96,Boston,1996 一缺点。基于分块主颜色的图像检索方法在利用了 [C].New York-ACM Press,1996。 (编辑修荣荣) 

因篇幅问题不能全部显示,请点此查看更多更全内容