基于强弱联合半监督直觉模糊聚类的图像分割方法
技术领域
本发明属于数字图像处理领域,具体涉及一种图像分割方法,可用于自然图像的识别和计算机视觉的预处理。
背景技术
图像分割作为图像处理与后续图像理解之间的一个枢纽环节,一直是学者们研究的热点问题,其占有着越来越重要的地位。图像分割的目的是根据图像的自身特性,将其划分成若干个具有不同属性且无交集的子区域,每个子区域内的各个像素都具有不同程度的相似特性,不同子区域之间的像素特征也具有显著的差异性。近年来,图像分割技术已在卫星遥感、智能安防、无人驾驶、医学图像处理和生物特征识别等领域提供了可靠且有效的帮助。在实际应用过程中,随着分割场景的日趋复杂化,人们对图像分割技术的性能要求也越来越严格,相继出现了基于阈值、区域、聚类、边缘和人工神经网络的分割算法。其中,基于聚类的图像分割算法具有计算复杂度低、算法稳定性好、运行速度快等优点,受到了学者们的普遍关注。常用的聚类方法主要包括硬聚类算法、模糊聚类算法、层次聚类算法、密度峰值聚类算法以及谱聚类算法等。模糊聚类算法立足于模糊集理论的基本思想,对各个样本点数据给出了它们对于不同类别的隶属度,能够贴切地表示客观世界中事物亦此亦彼的特点,受到了学者们的广泛关注。
刘健庄于1992年提出了基于二维直方图的图像模糊聚类分割方法,该方法是一种基于局部搜索的无监督聚类方法,其除了考虑像素点的灰度信息外还考虑了像素点与其邻域的空间相关信息,利用经典的欧氏距离构造了模糊C-均值聚类目标函数,迭代计算得到像素点的隶属度,并由各像素点的隶属度实现图像分割。该方法在实现图像分割时存在两个方面的问题:一是未利用人工可以获得的少量先验信息,导致其对于最优解的搜索具有盲目性,容易陷入局部最优,从而造成对背景分布不均的图像分割性能不理想;二是未考虑图像中更多的模糊性和不确定性,使得对于某些模糊像素的分割并不准确。针对第一个问题,Yasunori等人在2009年提出了将监督隶属度引入到模糊C-均值聚类算法中,构建了半监督模糊C-均值聚类算法,其利用少量监督信息对聚类过程进行指导,提高了聚类分割精度。针对第二个问题,Chaira等人发现引入直觉模糊集理论可以考虑数据更多的模糊性,使得对模糊数据的分类更加精确,提出了基于直觉模糊集的直觉模糊聚类方法。
但是以上两种方法均使用经典的欧氏距离来构造模糊聚类目标函数,仅考虑了线性可分数据的情况,而实际上在绝大多数图像分割问题中,要处理的数据往往是线性不可分的,所以使用经典的欧氏距离来构造模糊聚类目标函数是不合理的。为了能够处理图像分割中线性不可分的情况,学者们又提出引入核函数的方法,将原始空间中线性不可分数据变换到一个更高维度的特征空间中,在高维度的特征空间内找到一个线性函数实现数据的划分。2012年,Li等人提出了基于邻近度的半监督核模糊C-均值数据聚类算法,该方法将半监督和KFCM算法有效结合不仅可以使线性不可分的数据得以划分,而且可以利用用户输入数据之间的邻近性来对聚类进行指导,最后通过在合成数据上的仿真实验验证了该方法的可行性和优越性。但是该方法由于依然未考虑数据更多的模糊性、未对人工先验信息进行充分地利用,因而存在对初始值比较敏感,容易陷入局部最优解,对于背景分布不均的图像分割性能不理想的问题。
发明内容
本发明的目的在于针对上有技术存在的不足,提供一种基于强弱联合半监督直觉模糊聚类的图像分割方法,以降低对初始值的敏感性,避免陷入局部最优,实现对低维线性不可分数据的分割,提高对背景分布不均的图像分割准确率。
为实现上述目的,本发明的技术包括:
(1)输入待分割的图像X,并设置初始参数值:聚类数目k,最大迭代次数T=100,终止阈值ε=10-5;
(2)在待分割图像X上进行人工划线标记,获取人工先验信息;
(3)对待分割的图像X进行直觉模糊化处理,求出图像各个像素点xj对应的隶属度μ(xj)、非隶属度v(xj)、犹豫度π(xj);
(4)利用SLIC算法将待分割图像X划分成Q个不同的子区域R={R1,R2,…,Ri,…,RQ},其中Ri表示第i个子区域,每个子区域内像素都具有不同程度的相似性;
(5)设计类标签传递的强弱联合半监督策略,利用人工标记的先验信息求出图像的强监督隶属度弱监督隶属度及初始直觉模糊聚类中心
(5a)将人工标记的像素作为强标签YS,对强标签所在的超像素区域内的所有像素赋予与强标签相同的类别标签,作为区域标签传播后的弱标签YW,再将强标签YS和弱标签YW分别转化成强先验隶属度和弱先验隶属度
(5b)使用强先验隶属度和弱先验隶属度对无标记像素进行隶属度的估计,计算得到强估计隶属度和弱估计隶属度
(5c)分别将强估计隶属度和弱估计隶属度与其各自对应的强先验隶属度和弱先验隶属度合并,作为类标签传递后的强监督隶属度和弱监督隶属度
(5d)将弱监督隶属度带入计算初始聚类中心ci(1),再对其做直觉模糊化处理得到初始直觉模糊聚类中心
(6)将核函数、强监督隶属度、弱监督隶属度引入到直觉模糊聚类目标函数中,设计强弱联合半监督直觉模糊聚类目标函数JLP-SKIFCM:
其中,表示一个具有N个像素点的彩色图像的直觉模糊集表示,为第j个像素xj的直觉模糊集表示,k是聚类数目,uij表示像素xj对于第i类的隶属度,满足 表示第i类的直觉模糊聚类中心,μ(ci)表示聚类中心ci对应的隶属度、v(ci)表示聚类中心ci对应的非隶属度、π(ci)表示聚类中心ci对应的犹豫度,η1是强监督项的权重指数,η2是弱监督项的权重指数,表示第j个像素点对于第i类的强监督隶属度,表示像素xj对于第i类的弱监督隶属度,表示引入核函数的直觉模糊距离度量;
(7)利用拉格朗日乘子法最小化目标函数JLP-SKIFCM,求出隶属度uij和直觉模糊聚类中心的更新式,并根据更新式迭代计算隶属度uij和直觉模糊聚类中心
(8)判断迭代终止条件:若或迭代次数t>T,则获得隶属度矩阵U和直觉模糊聚类中心执行(9);否则,令t=t+1,返回迭代再次根据更新式计算隶属度uij和直觉模糊聚类中心
(9)利用获得的隶属度矩阵U根据最大隶属度原则对各个像素点进行分类,得到图像像素的聚类标签,输出图像X的分割结果。
本发明与现有技术相比,具有以下有益的技术效果:
第一,本发明设计了类标签传递的强弱联合半监督策略,将人工可以获得的先验信息进行充分地利用,使其对聚类过程进行有效指导,解决了直觉模糊聚类算法对初始值敏感且容易陷入局部最优的问题。
第二,本发明将核函数引入到直觉模糊聚类算法中,有效处理了直觉模糊聚类算法应用于图像分割时线性不可分的情况。
第三,本发明利用核函数,强监督隶属度和弱监督隶属度构造了基于强弱联合半监督直觉模糊聚类目标函数,提高了搜索性和寻优性,使得分割效果更为理想。
附图说明
图1为本发明的实现流程图;
图2为用本发明和现有方法对Berkeley图像数据库中的编号为124084的图像进行仿真分割的结果对比图;
图3为用本发明与现有方法对Weizmann图像数据库中的编号为nopeeking的图像进行仿真分割的结果对比图。
具体实施方式
以下结合附图对发明的实施和效果作进一步详细描述:
参见图1,本发明的实现步骤包括如下:
步骤1:输入待分割图像X并设置初始参数值和人工划线标记。
1.1)输入待分割的图像X,设置聚类数目k,最大迭代次数T=100,终止阈值ε=10-5;
1.2)在待分割图像上根据要分割的类别数k,对各个类进行人工划线标记,获取人工先验信息。
步骤2:对待分割的图像X进行直觉模糊化处理,求出图像各个像素点xj对应的隶属度μ(xj)、非隶属度v(xj)、犹豫度π(xj)。
2.1)求图像各个像素点xj对应的隶属度μ(xj),公式如下:
μ(xj)=(μR(xj),μG(xj),μB(xj)),
其中,μR(xj)为彩色图像中像素点xj在R通道下的隶属度,其利用最大最小值归一化方法求出, 和分别代表图像X在R分量下的最大值和最小值;
μG(xj)为彩色图像中像素点xj在G通道下的隶属度,其利用计算,和分别代表图像X在G分量下的最大值和最小值;
μB(xj)为彩色图像中像素点xj在B通道下的隶属度,其利用计算,和分别代表图像X在B分量下的最大值和最小值;
2.2)利用Segno直觉模糊生成算子求出图像各个像素点xj对应的非隶属度v(xj)和犹豫度π(xj):
π(xj)=1-μ(xj)-v(xj),
其中,δ为可变参数,其取值范围为(-1,∞)。
步骤3:利用SLIC算法对待分割图像X进行区域的划分。
利用SLIC算法将待分割图像X划分成Q个不同的子区域R={R1,R2,…,Ri,…,RQ},其中Ri表示第i个子区域,每个子区域内像素都具有不同程度的相似性。
步骤4:设计类标签传递的强弱联合半监督策略,利用人工标记的先验信息求出图像的强监督隶属度弱监督隶属度及初始直觉模糊聚类中心
4.1)将人工标记的像素作为强标签YS,对强标签YS所在的超像素区域内的所有像素赋予与强标签相同的类别标签,作为区域标签传播后的弱标签YW,再将强标签YS和弱标签YW分别转化成强先验隶属度和弱先验隶属度
4.1.1)将强标签YS按两种不同像素转化成强先验隶属度
对于没有强标签的像素xu,其对应的隶属度为0,即其中,为无强标签的像素xu对于第i类的强先验隶属度,i∈{1,2,…,k};
对于有强标签的像素xl且属于第i类,则否则,其中,为有强标签的像素xl对于第i类的强先验隶属度,为有强标签的像素xl对于第t类的强先验隶属度,t∈{1,2,…,k,t≠i};
4.1.2)将弱标签YW按如下两种不同像素转化成弱先验隶属度
对于没有弱标签的像素x′u,其对应的隶属度为0,即其中,为无弱标签的像素x′u对于第i类的弱先验隶属度,i∈{1,2,…,k};
对于有弱标签的像素x′l且属于第i类,则否则,其中,为有弱标签的像素x′l对于第i类的弱先验隶属度,为有弱标签的像素x′l对于第t类的弱先验隶属度,t∈{1,2,…,k,t≠i};
4.2)使用强先验隶属度和弱先验隶属度对无标记像素进行隶属度的估计,计算得到强估计隶属度和弱估计隶属度
4.2.1)使用强先验隶属度求强估计隶属度
其中,为有强标签的像素xl对于第i类的强先验隶属度,无强标记的像素xu对于第i类的强估计隶属度,l∈SL,SL表示有强标签的像素集合,表示有强标记的像素xl与无强标记的像素xu之间的欧氏距离;
4.2.2)使用弱先验隶属度求弱估计隶属度
其中,为有弱标签的像素x′l对于第i类的弱先验隶属度,为无弱标记的像素x′u对于第i类的弱估计隶属度,l∈WL,WL表示有弱标签的像素集合,表示有弱标记的像素x′l与无弱标记的像素x′u之间的欧氏距离;
4.3)分别将强估计隶属度和弱估计隶属度与其各自对应的强先验隶属度和弱先验隶属度合并,作为类标签传递后的强监督隶属度和弱监督隶属度
4.4)利用弱监督隶属度计算初始聚类中心ci(1):
4.5)对初始聚类中心ci(1)做直觉模糊化处理,得到初始直觉模糊聚类中心
步骤5:构造强弱联合半监督直觉模糊聚类目标函数JLP-SKIFCM。
5.1)定义核函数k(x,y)为高斯核,其表示为:
其中,σ是尺度参数,控制径向作用范围;
5.2)定义直觉模糊聚类目标函数JIFCM为:
其中,为像素xj的直觉模糊集表示,k为聚类数目,N为数据个数,uij表示像素xj对于第i类的隶属度,m为模糊指数,表示第i类的聚类中心ci的直觉模
糊集表示,是和之间的直觉欧式距离,表示为:
5.3)将核函数k(x,y)、强监督隶属度弱监督隶属度引入到直觉模糊聚类目标函数JIFCM中,得到强弱联合半监督直觉模糊聚类目标函数JLP-SKIFCM:
其中,表示一个具有N个像素点的彩色图像的直觉模糊集表示,为第j个像素xj的直觉模糊集表示,k是聚类数目,uij表示像素xj对于第i类的隶属度,满足 表示第i类的直觉模糊聚类中心,μ(ci)表示聚类中心ci对应的隶属度、v(ci)表示聚类中心ci对应的非隶属度、π(ci)表示聚类中心ci对应的犹豫度,η1是强监督项的权重指数,η2是弱监督项的权重指数,表示第j个像素点对于第i类的强监督隶属度,表示第j个像素点对于第i类的弱监督隶属度,表示引入核函数的直觉模糊距离度量,定义如下:是高斯径向基函数,表示核函数的尺度参数。
步骤6:利用拉格朗日乘子法最小化目标函数JLP-SKIFCM,求出隶属度uij和直觉模糊聚类中心的更新式。
6.1)对目标函数JLP-SKIFCM求关于隶属度uij的偏导数,得到隶属度的更新公式,其表示如下:
6.2)对目标函数JLP-SKIFCM求关于聚类中心的偏导数,得到直觉模糊聚类中心的更新公式,其表示如下:
其中,为像素xj对聚类中心ci隶属度下的核度量,
为像素xj对聚类中心ci非隶属度下的核度量,
为像素xj对聚类中心ci犹豫度下的核度量。
步骤7:迭代计算隶属度uij和直觉模糊聚类中心获得隶属度矩阵U和直觉模糊聚类中心
7.1)初始化迭代次数t=1
7.2)根据6.2)隶属度uij和直觉模糊聚类中心的更新公式,迭代计算每次迭代下的隶属度uij和直觉模糊聚类中心
7.3)计算与的差值:其中表示第t次迭代下的直觉模糊聚类中心,表示第t-1次迭代下的直觉模糊聚类中心;
7.4)将7.3)的差值Z与终止阈值ε比较,或者将迭代次数t与最大迭代次数T进行比较,判断终止条件:
若满足Z<ε或t>T,则获得隶属度矩阵U和直觉模糊聚类中心执行步骤8;
否则,令t=t+1,返回7.2)。
步骤8:输出图像X分割后的结果。
对获得的隶属度矩阵U根据最大隶属度原则对各个像素点进行分类,即将隶属度矩阵U中,每一列隶属度最大值对应的类别标签作为该位置像素的类别,得到整幅图像的聚类标签,输出图像X的分割结果。
以下结合仿真实验,对本发明的技术效果作进一步说明:
1.仿真条件:
仿真实验在计算机Intel(R)Core(TM)i5-4258U [email protected] 2.10GHz,8G内存,MATLAB R2019a软件环境下进行。
2.仿真内容:
仿真1,用本发明与现有KFCM方法、IFCM方法、sSFCM方法、SSFC-SC方法、eSFCM方法分别对Berkeley图像数据库中编号为124084的图像进行分割,结果如图2所示,其中:
2(a)是124084图像的原图;
2(b)是124084图像的人工标记图;
2(c)是124084图像的区域标签扩展图;
2(d)是124084图像的标准分割图;
2(e)是用现有KFCM方法对124084图像的分割结果;
2(f)是用现有sSFCM方法对124084图像的分割结果;
2(g)是用现有SSFC-SC方法对124084图像的分割结果;
2(h)是用现有eSFCM方法对124084图像的分割结果;
2(i)是用本发明方法对124084图像的分割结果。
从图2可以看出,本发明对于背景分布不均的图像可以将目标和背景完整地分离开,且对初始聚类中心不敏感,其分割效果明显优于现有KFCM方法、IFCM方法、sSFCM方法、SSFC-SC方法和eSFCM方法。
仿真2,用本发明和现有KFCM方法、IFCM方法、sSFCM方法、SSFC-SC方法、eSFCM方法,分别对Weizmann图像数据库中编号为nopeeking的图像进行分割,结果如图3所示,其中:
3(a)是nopeeking图像的原图;
3(b)是nopeeking图像的标准分割图;
3(c)是nopeeking图像的椒盐含噪图像,噪声强度为0.05;
3(d)是用现有KFCM方法对nopeeking图像的分割结果;
3(e)是用现有IFCM方法对nopeeking图像的分割结果;
3(f)是用现有sSFCM方法对nopeeking图像的分割结果;
3(g)是用现有SSFC-SC方法对nopeeking图像的分割结果;
3(h)是用现有eSFCM方法对nopeeking图像的分割结果;
3(i)是用本发明方法对nopeeking图像的分割结果。
从图3可以看出,本发明对于背景分布不均的图像可以将目标和背景完整地分离开,且对初始聚类中心不敏感,其分割效果明显优于现有KFCM方法、IFCM方法、sSFCM方法、SSFC-SC方法和eSFCM方法。