图像分类方法和装置

文档序号:8672 发布日期:2021-09-17 浏览:40次 英文

图像分类方法和装置

技术领域

本发明属于图像分类

技术领域

,具体涉及图像分类方法和装置。

背景技术

图像分类,根据各自在图像信息中所反映的不同特征,把不同类别的目标区分开来的图像处理方法。它利用计算机对图像进行定量分析,把图像或图像中的每个像元或区域划归为若干个类别中的某一种,以代替人的视觉判读。

图像分类方法一般有以下几种:

1.基于色彩特征的索引技术:色彩是物体表面的一种视觉特性,每种物体都有其特有的色彩特征,譬如人们说到绿色往往是和树木或草原相关,谈到蓝色往往是和大海或蓝天相关,同一类物体往拍几有着相似的色彩特征,因此我们可以根据色彩特征来区分物体.用色彩特特征进行图像分类一可以追溯到Swain和Ballard提出的色彩直方图的方法.由于色彩直方图具有简单且随图像的大小、旋转变化不敏感等特点,得到了研究人员的厂泛关注,目前几乎所有基于内容分类的图像数据库系统都把色彩分类方法作为分类的一个重要手段,并提出了许多改进方法,归纳起主要可以分为两类:全局色彩特征索引和局部色彩特征索引。

2.基于纹理的图像分类技术:纹理特征也是图像的重要特征之一,其本质是刻画像素的邻域灰度空间分布规律由于它在模式识别和计算机视觉等领域已经取得了丰富的研究成果,因此可以借用到图像分类中。在70年代早期,Haralick等人提出纹理特征的灰度共生矩阵表示法,这个方法提取的是纹理的灰度级空间相关性,它首先基于像素之间的距离和方向建立灰度共生矩阵,再由这个矩阵提取有意义的统计量作为纹理特征向量。基于一项人眼对纹理的视觉感知的心理研究,Tamuar等人提出可以模拟纹理视觉模型的6个纹理属性,分别是粒度,对比度,方向性,线型,均匀性和粗糙度。QBIC系统和MARS系统就采用的是这种纹理表示方法。在90年代初期,当小波变换的理论结构建一认起来之后,许多研究者开始研究如何用小波变换表示纹理特征。smiht和chang利用从小波子带中提取的统计量(平均值和方差)作为纹理特征。这个算法在112幅Brodatz纹理图像中达到了90%的准确率。为了利用中间带的特征,Chang和Kuo开发出一种树型结构的小波变化来进一步提高分类的准确性。还有一些研究者将小波变换和其他的变换结合起来以得到更好的性能,如Thygaarajna等人结合小波变换和共生矩阵,以兼顾基于统计的和基于变换的纹理分析算法的优点。

3.基于形状的图像分类技术:形状是图像的重要可视化内容之一在二维图像空间中,形状通常被认为是一条封闭的轮廓曲线所包围的区域,所以对形状的描述涉及到对轮廓边界的描述以及对这个边界所包围区域的描述.目前的基于形状分类方法大多围绕着从形状的轮廓特征和形状的区域特征建立图像索引。关于对形状轮廓特征的描述主要有:直线段描述、样条拟合曲线、傅立叶描述子以及高斯参数曲线等等。实际上更常用的办法是采用区域特征和边界特征相结合来进行形状的相似分类.如Eakins等人提出了一组重画规则并对形状轮廓用线段和圆弧进行简化表达,然后定义形状的邻接族和形族两种分族函数对形状进行分类.邻接分族主要采用了形状的边界信息,而形状形族主要采用了形状区域信息.在形状进行匹配时,除了每个族中形状差异外,还比较每个族中质心和周长的差异,以及整个形状的位置特征矢量的差异,查询判别距离是这些差异的加权和。

发明内容

本发明的主要目的在于提供图像分类方法和装置,与现有技术的图像分类方法不同的事,本发明基于图像的特征来进行分类,而在进行分类过程中,通过设置比较值来确定分类中心,进而构建分类树对待分类的图像进行分类,大幅度简化了分类的算法和过程,同时,分类结果的准确率依然维持在较高水平。

为达到上述目的,本发明的技术方案是这样实现的:

图像分类方法,所述方法执行以下步骤:

步骤1:提取训练分类图像的图像特征,得到训练分类图像特征组;

步骤2:对训练分类图像特征组进行特征分析,具体包括:将训练分类图像特征组中的每个特征进行归一化处理后,得到一个特征值;再设定多个比较值,计算特征值与比较值的差异值,以判断特征值与比较值的距离,将计算得到的差异值最小的比较值作为特征值的分类中心;

步骤3:基于每个比较值,以及以该比较值作为分类中心的特征值作为一个分类组;

步骤4:以分类组作为节点建立分类树,对待分类图像进行分类;具体包括:对待分类图像进行特征提取后,得到待分类图像的图像特征,将所有的待分类图像的图像特征作为一个待分类图像特征组,再将待分类图像特征组直接代入分类树进行分类,在分类树分类过程中,从待分类图像特征组中依次取出待分类图像的图像特征,将其放入分类树中进行分类,直到待分类图像特征组中所有的待分类图像的图像特征均被取出,完成图像分类。

进一步的,所述步骤1中提取训练分类图像的图像特征的方法包括:对训练分类图像的像素进行直接像素映射,从而得到像素的M维的像素映射系数,M为大于256的整数;根据像素映射系数,获得训练分类图像对应的M个直接像素映射图,其中,所述M个直接像素映射图中的第k个直接像素映射图中任意坐标点的值为所述任意坐标点对应在像素映射系数在第k个维度下的值,k为小于等于M的正整数;分别对所述M个直接像素映射图进行池化处理,从而得到所述待提取像素的M维的池化特征,所述M个直接像素映射图与所述池化特征的M个维度一一对应;对所述池化特征进行维度约减,从而得到所述待提取像素的用于表示所述池化特征的约减特征,所述约减特征的维度小于所述池化特征的维度;将得到的约减特征作为提取到的训练分类图像的图像特征。

进一步的,所述对训练分类图像的像素进行直接像素映射,得到像素的M维的像素映射系数的方法执行以下步骤:使用如下公式,对训练分类图像的像素进行直接像素映射:T=;其中,T为像素映射系数,为调整系数,取值范围为:0.2~0.5;表示训练分类图像的的像素R值,表示训练分类图像的的像素G值,表示训练分类图像的的像素B值。

进一步的,所述对所述M个直接像素映射图进行池化处理,从而得到所述待提取像素的M维的池化特征的方法执行以下步骤:使用如下公式进行池化处理:;其中,为每个直接像素图在所有直接像素图中出现的概率,表示直接像素图;为得到的池化特征。

进一步的,所述所述分类树为多叉树,包含至少两部分,且所述分类树中各个节点对应各自的分类组;根据所述分类树中各个节点对应的特征值,训练各个父节点各自对应的分类模型,所述特征值预先经过类型标注并存储在对应的节点中,所述父节点对应至少一个子节点,所述分类模型用于将语料划分到对应的子节点;获取待分类图像,所述待分类图像为未知分类组的待预测数据;通过所述分类树中各个节点的所述分类模型对所述待分类图像进行逐级分类。

进一步的,所述根据所述分类树中各个节点对应的特征值,训练各个父节点各自对应的分类模型,包括:获取当前父节点对应的各个子节点中对应的所述特征值,以及各个子节点对应的分类类型;根据各个子节点中对应的所述特征值以及各个子节点对应的分类类型,通过预设模型训练算法训练当前父节点对应的分类模型,所述预设模型训练算法包括支持向量机SVM算法、K最邻近分类KNN算法、决策树算法和朴素贝叶斯NBM算法中的至少一种;将训练得到的分类模型存储到当前父节点中。

进一步的,所述根据所述分类树中各个节点对应的训练语料,训练各个父节点各自对应的分类模型,还包括:将训练任务添加到等待队列中,所述训练任务用于指示训练父节点对应的分类模型;检测执行队列中训练任务的数量是否小于阈值;若执行队列中训练任务的数量小于所述阈值,则将所述等待队列中的训练任务添加到所述执行队列中,并执行所述获取当前父节点对应的各个子节点中对应的所述特征值,以及各个子节点对应的分类类型的步骤。

进一步的,在提取训练分类图像的图像特征之前,还包括对训练分类图像进行图像预处理的步骤,具体包括:根据所述训练分类图像的像素位置信息和像素灰度值信息,对所述训练分类图像进行滤波处理,生成滤波图像;所述像素位置信息是所述训练分类图像中的第一像素与所述第一像素既定邻域范围内其他像素之间的空间距离;所述像素灰度值信息是所述训练分类图像中的第一像素与所述第一像素周围的像素之间的灰度值的差分;根据所述滤波图像的局部像素信息和整体像素信息,对所述滤波图像进行增强处理,生成增强图像;根据所述增强图像,生成类梯度图;对所述类梯度图进行二值化处理,生成二值图像。

进一步的,所述根据所述训练分类图像的像素位置信息和像素灰度值信息,对所述训练分类图像进行滤波处理,具体包括:根据所述训练分类图像的像素位置信息,生成高斯模板;根据所述训练分类图像的像素灰度值信息,生成灰度值差分模板,其中,所述高斯模板与所述灰度值差分模板的大小相同;将所述高斯模板中的模板系数与所述灰度值差分模板中对应位置的模板系数相乘,将乘积作为生成的滤波系数模板中对应位置的模板系数;使用所述滤波系数模板,对所述训练分类图像进行滤波处理。

一种用于实现前述所述方法的图像分类装置。

本发明的图像分类方法和装置,具有如下有益效果:与现有技术的图像分类方法不同的事,本发明基于图像的特征来进行分类,而在进行分类过程中,通过设置比较值来确定分类中心,进而构建分类树对待分类的图像进行分类,大幅度简化了分类的算法和过程,同时,分类结果的准确率依然维持在较高水平。

附图说明

图1为本发明的实施例提供的图像分类方法的方法流程示意图;

图2为本发明的实施例提供的图像分类方法及装置的分类树的结构示意图;

图3为本发明的实施例提供的图像分类方法及装置的分类组的结构示意图;

图4为本发明的实施例提供的图像分类方法及装置的效率随着试验场次数变化的曲线示意图与现有技术的对比实验效果示意图。

具体实施方式

以下结合具体实施方式和附图对本发明的技术方案作进一步详细描述:

实施例1

如图1所示,

图像分类方法,所述方法执行以下步骤:

步骤1:提取训练分类图像的图像特征,得到训练分类图像特征组;

步骤2:对训练分类图像特征组进行特征分析,具体包括:将训练分类图像特征组中的每个特征进行归一化处理后,得到一个特征值;再设定多个比较值,计算特征值与比较值的差异值,以判断特征值与比较值的距离,将计算得到的差异值最小的比较值作为特征值的分类中心;

步骤3:基于每个比较值,以及以该比较值作为分类中心的特征值作为一个分类组;

步骤4:以分类组作为节点建立分类树,对待分类图像进行分类;具体包括:对待分类图像进行特征提取后,得到待分类图像的图像特征,将所有的待分类图像的图像特征作为一个待分类图像特征组,再将待分类图像特征组直接代入分类树进行分类,在分类树分类过程中,从待分类图像特征组中依次取出待分类图像的图像特征,将其放入分类树中进行分类,直到待分类图像特征组中所有的待分类图像的图像特征均被取出,完成图像分类。

实施例2

在上一实施例的基础上,所述步骤1中提取训练分类图像的图像特征的方法包括:对训练分类图像的像素进行直接像素映射,从而得到像素的M维的像素映射系数,M为大于256的整数;根据像素映射系数,获得训练分类图像对应的M个直接像素映射图,其中,所述M个直接像素映射图中的第k个直接像素映射图中任意坐标点的值为所述任意坐标点对应在像素映射系数在第k个维度下的值,k为小于等于M的正整数;分别对所述M个直接像素映射图进行池化处理,从而得到所述待提取像素的M维的池化特征,所述M个直接像素映射图与所述池化特征的M个维度一一对应;对所述池化特征进行维度约减,从而得到所述待提取像素的用于表示所述池化特征的约减特征,所述约减特征的维度小于所述池化特征的维度;将得到的约减特征作为提取到的训练分类图像的图像特征。

具体的,图像特征主要有图像的颜色特征、纹理特征、形状特征和空间关系特征。

颜色特征是一种全局特征,描述了图像或图像区域所对应的景物的表面性质;纹理特征也是一种全局特征,它也描述了图像或图像区域所对应景物的表面性质;形状特征有两类表示方法,一类是轮廓特征,另一类是区域特征,图像的轮廓特征主要针对物体的外边界,而图像的区域特征则关系到整个形状区域;空间关系特征,是指图像中分割出来的多个目标之间的相互的空间位置或相对方向关系,这些关系也可分为连接/邻接关系、交叠/重叠关系和包含/包容关系等。

实施例3

在上一实施例的基础上,所述对训练分类图像的像素进行直接像素映射,得到像素的M维的像素映射系数的方法执行以下步骤:使用如下公式,对训练分类图像的像素进行直接像素映射:T=;其中,T为像素映射系数,为调整系数,取值范围为:0.2~0.5;表示训练分类图像的的像素R值,表示训练分类图像的的像素G值,表示训练分类图像的的像素B值。

实施例4

在上一实施例的基础上,,所述对所述M个直接像素映射图进行池化处理,从而得到所述待提取像素的M维的池化特征的方法执行以下步骤:使用如下公式进行池化处理:;其中,为每个直接像素图在所有直接像素图中出现的概率,表示直接像素图;为得到的池化特征。

具体的,池化,也即降采样(subsample),降低数据的大小。常用的池化方法是:最大值池化(max_pooling),平均值池化。其中,最常用的是最大值池化。通过使用一个池化核,并采用max_pooling进行池化。

实施例5

在上一实施例的基础上,所述所述分类树为多叉树,包含至少两部分,且所述分类树中各个节点对应各自的分类组;根据所述分类树中各个节点对应的特征值,训练各个父节点各自对应的分类模型,所述特征值预先经过类型标注并存储在对应的节点中,所述父节点对应至少一个子节点,所述分类模型用于将语料划分到对应的子节点;获取待分类图像,所述待分类图像为未知分类组的待预测数据;通过所述分类树中各个节点的所述分类模型对所述待分类图像进行逐级分类。

具体的,树家族是为了实现方便快捷的查找而存在的。树的高度是命中查找的一个不可抗拒的时间下限。在一定的数据条件下,树的高度和宽度是互相制约的。(就像一定面积下,矩形的长和宽是互相制约的)而树家族中最简单的二叉树,尽管易于实现,却不能有实际的价值。其最最令人发指的是二叉树的高度太高。n叉树的提出和实现解决了二叉树的不足,典型的n叉树有:2-3-4树/红黑树和B树。

实施例6

在上一实施例的基础上,所述根据所述分类树中各个节点对应的特征值,训练各个父节点各自对应的分类模型,包括:获取当前父节点对应的各个子节点中对应的所述特征值,以及各个子节点对应的分类类型;根据各个子节点中对应的所述特征值以及各个子节点对应的分类类型,通过预设模型训练算法训练当前父节点对应的分类模型,所述预设模型训练算法包括支持向量机SVM算法、K最邻近分类KNN算法、决策树算法和朴素贝叶斯NBM算法中的至少一种;将训练得到的分类模型存储到当前父节点中。

实施例7

在上一实施例的基础上,所述根据所述分类树中各个节点对应的训练语料,训练各个父节点各自对应的分类模型,还包括:将训练任务添加到等待队列中,所述训练任务用于指示训练父节点对应的分类模型;检测执行队列中训练任务的数量是否小于阈值;若执行队列中训练任务的数量小于所述阈值,则将所述等待队列中的训练任务添加到所述执行队列中,并执行所述获取当前父节点对应的各个子节点中对应的所述特征值,以及各个子节点对应的分类类型的步骤。

实施例8

在上一实施例的基础上,在提取训练分类图像的图像特征之前,还包括对训练分类图像进行图像预处理的步骤,具体包括:根据所述训练分类图像的像素位置信息和像素灰度值信息,对所述训练分类图像进行滤波处理,生成滤波图像;所述像素位置信息是所述训练分类图像中的第一像素与所述第一像素既定邻域范围内其他像素之间的空间距离;所述像素灰度值信息是所述训练分类图像中的第一像素与所述第一像素周围的像素之间的灰度值的差分;根据所述滤波图像的局部像素信息和整体像素信息,对所述滤波图像进行增强处理,生成增强图像;根据所述增强图像,生成类梯度图;对所述类梯度图进行二值化处理,生成二值图像。

具体的,滤波是将信号中特定波段频率滤除的操作,是抑制和防止干扰的一项重要措施。是根据观察某一随机过程的结果,对另一与之有关的随机过程进行估计的概率理论与方法。滤波一词起源于通信理论,它是从含有干扰的接收信号中提取有用信号的一种技术。“接收信号”相当于被观测的随机过程,“有用信号”相当于被估计的随机过程。例如用雷达跟踪飞机,测得的飞机位置的数据中,含有测量误差及其他随机干扰,如何利用这些数据尽可能准确地估计出飞机在每一时刻的位置、速度、加速度等,并预测飞机未来的位置,就是一个滤波与预测问题。这类问题在电子技术、航天科学、控制工程及其他科学技术部门中都是大量存在的。历史上最早考虑的是维纳滤波,后来R.E.卡尔曼和R.S.布西于20世纪60年代提出了卡尔曼滤波。现对一般的非线性滤波问题的研究相当活跃。

实施例9

在上一实施例的基础上,所述根据所述训练分类图像的像素位置信息和像素灰度值信息,对所述训练分类图像进行滤波处理,具体包括:根据所述训练分类图像的像素位置信息,生成高斯模板;根据所述训练分类图像的像素灰度值信息,生成灰度值差分模板,其中,所述高斯模板与所述灰度值差分模板的大小相同;将所述高斯模板中的模板系数与所述灰度值差分模板中对应位置的模板系数相乘,将乘积作为生成的滤波系数模板中对应位置的模板系数;使用所述滤波系数模板,对所述训练分类图像进行滤波处理。

实施例10

一种用于实现前述所述方法的图像分类装置。

以上所述仅为本发明的一个实施例子,但不能以此限制本发明的范围,凡依据本发明所做的结构上的变化,只要不失本发明的要义所在,都应视为落入本发明保护范围之内受到制约。

所属技术领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的系统的具体工作过程及有关说明,可以参考前述方法实施例中的对应过程,在此不再赘述。

需要说明的是,上述实施例提供的系统,仅以上述各功能模块的划分进行举例说明,在实际应用中,可以根据需要而将上述功能分配由不同的功能模块来完成,即将本发明实施例中的模块或者步骤再分解或者组合,例如,上述实施例的模块可以合并为一个模块,也可以进一步拆分成多个子模块,以完成以上描述的全部或者部分功能。对于本发明实施例中涉及的模块、步骤的名称,仅仅是为了区分各个模块或者步骤,不视为对本发明的不当限定。

所属技术领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的存储装置、处理装置的具体工作过程及有关说明,可以参考前述方法实施例中的对应过程,在此不再赘述。

本领域技术人员应该能够意识到,结合本文中所公开的实施例描述的各示例的模块、方法步骤,能够以电子硬件、计算机软件或者二者的结合来实现,软件模块、方法步骤对应的程序可以置于随机存储器(RAM)、内存、只读存储器(ROM)、电可编程ROM、电可擦除可编程ROM、寄存器、硬盘、可移动磁盘、CD-ROM、或技术领域内所公知的任意其它形式的存储介质中。为了清楚地说明电子硬件和软件的可互换性,在上述说明中已经按照功能一般性地描述了各示例的组成及步骤。这些功能究竟以电子硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。本领域技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本发明的范围。

术语“第一”、“第二”等是用于区别类似的对象,而不是用于描述或表示特定的顺序或先后次序。

术语“包括”或者任何其它类似用语旨在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备/装置不仅包括那些要素,而且还包括没有明确列出的其它要素,或者还包括这些过程、方法、物品或者设备/装置所固有的要素。

至此,已经结合附图所示的优选实施方式描述了本发明的技术方案,但是,本领域技术人员容易理解的是,本发明的保护范围显然不局限于这些具体实施方式。在不偏离本发明的原理的前提下,本领域技术人员可以对相关技术特征作出等同的更改或替换,这些更改或替换之后的技术方案都将落入本发明的保护范围之内。

以上所述,仅为本发明的较佳实施例而已,并非用于限定本发明的保护范围。

完整详细技术资料下载
上一篇:石墨接头机器人自动装卡簧、装栓机
下一篇:一种对象识别方法及装置、芯片及电子设备

网友询问留言

已有0条留言

还没有人留言评论。精彩留言会获得点赞!

精彩留言,会给你点赞!