一种基于自适应权重的肺结节ct图像重排序方法
技术领域
本发明一种基于自适应权重的肺结节CT图像重排序方法,属于肺结节CT图像检索
技术领域
。背景技术
在肺结节CT图像检索中,在图像库中检索出图像的排名越靠前,则该图像与待检索图像越相似。在图像检索的现有众多方法中,哈希算法广为应用。通过使用哈希算法将待检索图像和图像库中的图像进行哈希映射,将图像特征映射为固定位哈希码,随后将待检索图像的哈希码与图像库中图像的哈希码进行相似性度量比较。最后按相似度从大到小进行排序,给出最为相似的肺结节CT图像。
但是,目前现有的图像重排序算法包括贪心算法、QsRank、超图等都有其算法局限性。贪心算法依附于首选种子图像与待检索图像是否最为相近,如果种子图像的选取不合适会直接导致排序结果的不准确。QsRank算法仅对PCA主成分分析哈希算法有效,而对其他的哈希算法的准确率并没有显著的提高,不具备鲁棒性。超图算法考虑了不同图像之间的亲和关系使得计算量大大增加。
因此,提出了一种基于自适应权重的肺结节CT图像重排序方法,通过加入自适应权重,使得各维特征向量对于图像特征的贡献度得到体现。
发明内容
本发明为了克服现有技术中存在的不足,所要解决的技术问题为:提供一种基于自适应权重的肺结节CT图像重排序方法的改进。
为了解决上述技术问题,本发明采用的技术方案为:一种基于自适应权重的肺结节CT图像重排序方法,包括如下步骤:
步骤一:图像数据集获取:所述图像数据集包括待检索肺部CT图像和图像库中肺部CT图像;
步骤二:图像预处理:将待检索肺部CT图像和图像库中肺部CT图像进行图像预处理,截取以RIO为中心的最小外接矩形图像,得到待检索的肺结节CT图像和图像库中的肺结节CT图像;
步骤三:图像特征提取:将经过预处理后的肺结节CT图像输入CNN网络进行深度特征提取;
步骤四:不同哈希码位的自适应权重计算;
步骤五:相似性度量:将待检索肺结节CT图像与图像库中的肺结节CT图像根据汉明距离进行排序,得到相似性最大的肺结节CT图像。
所述步骤一中图像库中的肺部CT图像具体采用公开的LIDC数据库中的肺部CT图像。
所述步骤三中在对肺结节CT图像进行深度特征提取时,通过PCA对特征矩阵中进行主成分分析。
所述步骤四中对不同哈希码位的自适应权重具体为:
步骤4.1:假设待检索的肺结节CT图像特征为Cq=[C1,C2,...,Cn],映射后的哈希特征为Hq=[h1,h2,...,hn],其中n代表哈希码位;
步骤4.2:假设图像库中的肺结节CT图像特征为Imgq=[I1,I2,...,In],映射后的哈希特征为Himg=[himg1,himg2,...,himgn];
步骤4.3:权重计算:
上式中:Ci代表各维特征向量与对应各维坐标轴的距离,Ki代表所有特征向量与应对各维坐标轴距离的均值。
所述步骤五中相似性度量具体步骤为:
步骤5.1:待检索肺结节CT图像与图像库中肺结节CT图像的相似性度量,通过汉明距离进行计算,公式如下:
步骤5.2:通过对D进行从小到大的排序,得到最为相似的肺结节CT图像。
本发明相对于现有技术具备的有益效果为:本发明提供的基于自适应权重的肺结节CT图像重排序方法充分考虑了不同位哈希码对于图像特征的贡献度,提出了不同码位的自适应权重;在进行相似性度量时,采用汉明距离从小到大进行排序,大大减少了欧氏距离度量的计算复杂度。
附图说明
下面结合附图对本发明做进一步说明:
图1为本发明方法的框架图。
具体实施方式
如图1所示,本发明一种基于自适应权重的肺结节CT图像重排序方法,包括如下步骤:
步骤一:图像数据集获取:所述图像数据集包括待检索肺部CT图像和图像库中肺部CT图像;
步骤二:图像预处理:将待检索肺部CT图像和图像库中肺部CT图像进行图像预处理,截取以RIO为中心的最小外接矩形图像,得到待检索的肺结节CT图像和图像库中的肺结节CT图像;
步骤三:图像特征提取:将经过预处理后的肺结节CT图像输入CNN网络进行深度特征提取;
步骤四:不同哈希码位的自适应权重计算;
步骤五:相似性度量:将待检索肺结节CT图像与图像库中的肺结节CT图像根据汉明距离进行排序,得到相似性最大的肺结节CT图像。
所述步骤一中图像库中的肺部CT图像具体采用公开的LIDC数据库中的肺部CT图像。
所述步骤三中在对肺结节CT图像进行深度特征提取时,通过PCA对特征矩阵中进行主成分分析。
所述步骤四中对不同哈希码位的自适应权重具体为:
步骤4.1:假设待检索的肺结节CT图像特征为Cq=[C1,C2,...,Cn],映射后的哈希特征为Hq=[h1,h2,...,hn],其中n代表哈希码位;
步骤4.2:假设图像库中的肺结节CT图像特征为Imgq=[I1,I2,...,In],映射后的哈希特征为Himg=[himg1,himg2,...,himgn];
步骤4.3:权重计算:
上式中:Ci代表各维特征向量与对应各维坐标轴的距离,Ki代表所有特征向量与应对各维坐标轴距离的均值。
所述步骤五中相似性度量具体步骤为:
步骤5.1:待检索肺结节CT图像与图像库中肺结节CT图像的相似性度量,通过汉明距离进行计算,公式如下:
步骤5.2:通过对D进行从小到大的排序,得到最为相似的肺结节CT图像。
本发明提供的基于自适应权重的肺结节CT图像重排序方法解决了前哈希函数对特征进行统一映射,未考虑不同位对特征贡献度不同的问题,使得检索出的肺结节CT图像中排名较靠前的部分肺结节图像与待检索肺结节图像相似度并不高,因此,本发明提出了一种针对上述问题的不同哈希码位的自适应权重,对肺结节图像进行排序。
本发明的具体步骤如下:
步骤A:图像预处理,将公开的LIDC数据库中的肺部CT图像进行图像预处理,截取以ROI为中心的最小外接矩形图像。
步骤B:图像特征提取,将步骤A得到的处理后的肺结节图像输入CNN网络进行深度特征提取。由于此特征矩阵中有一些值为0,对于图像特征没有意义,所以对此特征进行PCA主成分分析。
步骤C:权重设计,哈希映射。
假设待检索的肺结节CT图像特征为Cq=[C1,C2,...,Cn],映射后的哈希特征为Hq=[h1,h2,...,hn],其中n代表哈希码位。图像库中的肺结节图像特征为Imgq=[I1,I2,...,In],映射后的哈希特征为Himg=[himg1,himg2,...,himgn]。本发明提出的权重公式为:其中Ci代表各维特征向量与对应各维坐标轴的距离。Ki代表所有特征向量与应对各维坐标轴距离的均值。在本发明中,可以看出,各维特征向量的权重是根据特征向量与各维坐标轴距离进行计算的,且距离越远,权重越小。反之距离越近,权重越大。
步骤D:相似性度量。
Step1:待检索肺结节图像与图像库中图像的相似性度量,通过汉明距离进行计算;
公式如下:
Step2:通过对D进行从小到大的排序,得到最为相似的肺结节CT图像。
本发明通过提出的自适应权重函数将不同位哈希码对于图像特征具有不同的贡献度进行量化,能够在进行相似性度量时,将不同位哈希码对于图像特征的贡献度进行充分计算考虑,使检索到的相似图像的相似度最高。
关于本发明具体结构需要说明的是,本发明采用的各部件模块相互之间的连接关系是确定的、可实现的,除实施例中特殊说明的以外,其特定的连接关系可以带来相应的技术效果,并基于不依赖相应软件程序执行的前提下,解决本发明提出的技术问题,本发明中出现的部件、模块、具体元器件的型号、连接方式除具体说明的以外,均属于本领域技术人员在申请日前可以获取到的已公开专利、已公开的期刊论文、或公知常识等现有技术,无需赘述,使得本案提供的技术方案是清楚、完整、可实现的,并能根据该技术手段重现或获得相应的实体产品。
最后应说明的是:以上各实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述各实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分或者全部技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的范围。
- 上一篇:石墨接头机器人自动装卡簧、装栓机
- 下一篇:一种基于计算机的图像检索方法及装置