模型训练方法及装置、图像识别方法及装置

文档序号:8676 发布日期:2021-09-17 浏览:33次 英文

模型训练方法及装置、图像识别方法及装置

技术领域

本申请涉及神经网络

技术领域

,具体涉及一种模型训练方法及装置、图像识别方法及装置。

背景技术

近年来,随着图像采集技术的迅速发展,三维图像序列日益受到广泛关注,尤其是能够辅助医生诊断的三维医学图像序列,比如电子计算机断层扫描(ComputedTomography,CT)图像序列。

通常情况下,三维医学图像序列包括多个部位,为了方便后续处理,需要确定三维医学图像序列中的图像各自所属的部位(即确定三维医学图像序列中的图像各自对应的类别),以便基于部位提取出该部位对应的图像。然而,在现有技术中存在一些用于确定三维医学图像序列中图像各自所属部位的方法,该些方法识别部位时的精准度比较低。

发明内容

为了解决上述技术问题,提出了本申请。本申请实施例提供了一种模型训练方法及装置、图像识别方法及装置。

第一方面,本申请一实施例提供了一种模型训练方法,该模型训练方法包括:基于M幅图像各自对应的第一类别分配权重数据训练第一识别模型,得到第二识别模型,其中,M幅图像属于待识别图像序列样本,M幅图像对应N个类别,M和N均为大于1的正整数;基于M幅图像各自对应的第一类别分配权重数据和第二识别模型,确定M幅图像各自对应的第二类别分配权重数据;基于M幅图像各自对应的第二类别分配权重数据训练第二识别模型,得到图像识别模型,其中,图像识别模型用于确定待识别图像序列中的图像各自对应的类别识别结果。

结合第一方面,在第一方面的某些实现方式中,基于M幅图像各自对应的第一类别分配权重数据和第二识别模型,确定M幅图像各自对应的第二类别分配权重数据,包括:利用第二识别模型,确定M幅图像各自对应的第一类别识别结果;基于M幅图像各自对应的类别标签数据和M幅图像各自对应的第一类别识别结果,更新M幅图像各自对应的第一类别分配权重数据,得到M幅图像各自对应的第二类别分配权重数据。

结合第一方面,在第一方面的某些实现方式中,基于M幅图像各自对应的类别标签数据和M幅图像各自对应的第一类别识别结果,更新M幅图像各自对应的第一类别分配权重数据,得到M幅图像各自对应的第二类别分配权重数据,包括:基于M幅图像各自对应的类别标签数据和M幅图像各自对应的第一类别识别结果,确定M幅图像中的P幅待增权图像,其中,待增权图像包括类别识别错误的图像,P为正整数;增量更新P幅待增权图像各自对应的第一类别分配权重数据,得到P幅待增权图像各自对应的第二类别分配权重数据;基于P幅待增权图像各自对应的第二类别分配权重数据,得到M幅图像各自对应的第二类别分配权重数据。

结合第一方面,在第一方面的某些实现方式中,增量更新P幅待增权图像各自对应的第一类别分配权重数据,得到P幅待增权图像各自对应的第二类别分配权重数据,包括:基于P幅待增权图像各自对应的类别标签数据,确定P幅待增权图像和N个类别之间的从属关系;基于从属关系,将P幅待增权图像划分为Q个连续图像子序列,Q为正整数;针对Q个连续图像子序列中的每个连续图像子序列,增量更新连续图像子序列中的待增权图像各自对应的第一类别分配权重数据,得到连续图像子序列中的待增权图像各自对应的第二类别分配权重数据。

结合第一方面,在第一方面的某些实现方式中,增量更新连续图像子序列中的待增权图像各自对应的第一类别分配权重数据,得到连续图像子序列中的待增权图像各自对应的第二类别分配权重数据,包括:基于连续图像子序列的图像数量信息,确定连续图像子序列中的待增权图像各自对应的增量权重数据;基于连续图像子序列中的待增权图像各自对应的增量权重数据和第一类别分配权重数据,得到连续图像子序列中的待增权图像各自对应的第二类别分配权重数据。

结合第一方面,在第一方面的某些实现方式中,基于连续图像子序列的图像数量信息,确定连续图像子序列中的待增权图像各自对应的增量权重数据,包括:若是基于图像数量信息确定连续图像子序列的图像数量大于或等于预设图像数量,则基于连续图像子序列的序列位置信息,确定连续图像子序列的起始端待增权图像,其中,起始端待增权图像为最靠近连续图像子序列所属的类别的序列边缘的待增权图像;以起始端待增权图像为增量起点,基于预设最大增量值以线性减小的方式,确定连续图像子序列中的待增权图像各自对应的增量权重数据。

结合第一方面,在第一方面的某些实现方式中,基于连续图像子序列的图像数量信息,确定连续图像子序列中的待增权图像各自对应的增量权重数据,包括:若是基于图像数量信息确定连续图像子序列的图像数量小于预设图像数量,则基于预设最小增量值,确定连续图像子序列中的待增权图像各自对应的增量权重数据。

结合第一方面,在第一方面的某些实现方式中,基于M幅图像各自对应的第二类别分配权重数据训练第二识别模型,得到图像识别模型,包括:基于M幅图像各自对应的第二类别分配权重数据训练第二识别模型,得到第三识别模型;利用第三识别模型,确定M幅图像各自对应的第二类别识别结果;基于M幅图像各自对应的类别标签数据和M幅图像各自对应的第二类别识别结果,得到M幅图像各自对应的当前类别分配权重数据;基于M幅图像各自对应的第一类别分配权重数据、第二类别分配权重数据和当前类别分配权重数据,确定M幅图像各自对应的第三类别分配权重数据;基于M幅图像各自对应的第三类别分配权重数据训练第三识别模型,得到图像识别模型。

结合第一方面,在第一方面的某些实现方式中,基于M幅图像各自对应的第二类别分配权重数据训练第二识别模型,得到图像识别模型,包括:基于M幅图像各自对应的第二类别分配权重数据训练第二识别模型,得到第四识别模型;基于M幅图像各自对应的第二类别分配权重数据和第四识别模型,确定M幅图像各自对应的第四类别分配权重数据;基于M幅图像各自对应的第四类别分配权重数据训练第四识别模型,得到第五识别模型;基于M幅图像各自对应的第四类别分配权重数据和第五识别模型,得到第六识别模型;重复执行基于当前训练轮次开始前得到的类别分配权重数据训练当前训练轮次的模型以得到新的模型,并基于新的模型确定下一训练轮次开始前得到的类别分配权重数据的步骤,直至得到收敛的新的模型,将收敛的新的模型确定为图像识别模型。

第二方面,本申请一实施例提供了一种图像识别方法,该图像识别方法包括:确定图像识别模型,该图像识别模型基于上述第一方面提及的模型训练方法训练得到;利用图像识别模型,确定待识别图像序列中的图像各自对应的类别识别结果。

第三方面,本申请一实施例提供了一种模型训练装置,该模型训练装置包括:第一训练模块,用于基于M幅图像各自对应的第一类别分配权重数据训练第一识别模型,得到第二识别模型,其中,M幅图像属于待识别图像序列样本,M幅图像对应N个类别,M和N均为大于1的正整数;第二确定模块,用于基于M幅图像各自对应的第一类别分配权重数据和第二识别模型,确定M幅图像各自对应的第二类别分配权重数据;第二训练模块,用于基于M幅图像各自对应的第二类别分配权重数据训练第二识别模型,得到图像识别模型,其中,图像识别模型用于确定待识别图像序列中的图像各自对应的类别识别结果。

第四方面,本申请一实施例提供了一种图像识别装置,该图像识别装置包括:模型确定模块,用于确定图像识别模型,该图像识别模型基于上述第一方面提及的模型训练方法训练得到;识别结果确定模块,用于利用图像识别模型,确定待识别图像序列中的图像各自对应的类别识别结果。

第五方面,本申请一实施例提供了一种计算机可读存储介质,该存储介质存储有计算机程序,该计算机程序用于执行上述第一方面提及的模型训练方法和/或第二方面所提及的图像识别方法。

第六方面,本申请一实施例提供了一种电子设备,该电子设备包括:处理器;用于存储处理器可执行指令的存储器;该处理器用于执行上述第一方面提及的模型训练方法和/或第二方面所提及的图像识别方法。

本申请实施例提供的模型训练方法,考虑到图像样本相对于模型的学习难易问题,为待识别图像序列样本中的图像各自分配一第一类别分配权重数据(又可称为初始类别分配权重数据),并且,利用训练中途得到的中间模型修正待识别图像序列样本中的图像各自对应的第一类别分配权重数据,得到待识别图像序列样本中的图像各自对应的第二类别分配权重数据,并利用待识别图像序列样本中的图像各自对应的第二类别分配权重数据继续训练中间模型,以得到收敛的图像识别模型。如此设置,本申请实施例能够为错误预测的图像样本重新定义其学习难易权重,进而使模型更多关注到错误预测的图像样本,极大提高训练得到的图像识别模型的识别精准度。

附图说明

图1所示为本申请一实施例提供的模型训练方法的流程示意图。

图2所示为本申请一实施例提供的确定M幅图像各自对应的第二类别分配权重数据的流程示意图。

图3所示为本申请一实施例提供的更新M幅图像各自对应的第一类别分配权重数据,得到M幅图像各自对应的第二类别分配权重数据的流程示意图。

图4所示为本申请一实施例提供的增量更新P幅待增权图像各自对应的第一类别分配权重数据,得到P幅待增权图像各自对应的第二类别分配权重数据的流程示意图。

图5所示为本申请一实施例提供的增量更新连续图像子序列中的待增权图像各自对应的第一类别分配权重数据,得到连续图像子序列中的待增权图像各自对应的第二类别分配权重数据的流程示意图。

图6所示为本申请一实施例提供的确定连续图像子序列中的待增权图像各自对应的增量权重数据的流程示意图。

图7所示为本申请一实施例提供的基于M幅图像各自对应的第二类别分配权重数据训练第二识别模型,得到图像识别模型的流程示意图。

图8所示为本申请一实施例提供的图像识别方法的流程示意图。

图9所示为本申请一实施例提供的模型训练装置的结构示意图。

图10所示为本申请一实施例提供的图像识别装置的结构示意图。

图11所示为本申请一实施例提供的电子设备的结构示意图。

具体实施方式

下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。

众所周知,通常情况下,三维医学图像序列包括多个部位。比如,三维医学图像序列为整个人体的医学图像序列,共包括13个部位,分别为脑,脑鼻咽,鼻咽,鼻咽颈,颈,颈胸,胸,胸腹,腹,腹盆腔,盆腔,盆腔下肢和下肢。为了方便后续处理,需要确定三维医学图像序列中的图像各自所属的部位(即确定三维医学图像序列中的图像各自对应的类别),以便基于部位提取出该部位对应的图像。比如,方便阅片人基于划分好的部位图像进行后续的一些操作,比如品质控制(Quality Control,QC)等。

现有的部位识别模型能够解决如何从三维医学图像序列中,基于具体部位提取出该具体部位对应的图像的技术问题,但是精准度比较低。原因之一在于类别不均衡的问题,原因另一在于难易样本的问题。

针对上述提及的类别不均衡的问题,具体而言,一般来说,人体易出现病灶的部位较为集中,因此相关部位的图像采集会更频繁,例如头、胸、腹,而不易出现病灶的部位(例如脚,小腿等)的图像采集量会少得多。不同部位的图像数据量差异过大会使得部位识别模型在学习的过程中更偏向于学习数据量较多的部位的特征,数据量较小的部位由于数量问题,对模型更新的贡献太少,导致模型无法学习到其特征,这极大地影响了模型的最终效果。

针对上述提及的难易样本的问题,利用上述提及的共包括13个部位的整个人体的医学图像序列举例解释。具体而言,在所列举的13个部位中,包括7个具体部位和6个过渡部位。其中,7个具体部位包括脑,鼻咽,颈,胸,腹,盆腔和下肢,6个过渡部位包括脑鼻咽,鼻咽颈,颈胸,胸腹,腹盆腔和盆腔下肢。即,每相邻的两个具体部位之间存在一个过渡部位。过渡部位作为两个相邻的具体部位的中间区域,其特点是在图像结构上既有上一个具体部位的特征,又有下一个具体部位的特征,因此在学习过程中更难被学习。此外,过渡部位只是两个具体部位的短暂过渡,在数据量上也相对较少,因此过渡部位也会存在类别不平衡的现象。因此,通常情况下,具体部位可被称作简单样本,过渡部位可被称作困难样本。

为了解决部位识别模型的识别精准度较差的技术问题,本申请实施例提供一种模型训练方法及装置、图像识别方法及装置,以实现提高图像识别的识别精准度的目的。需要注意的是,本申请实施例提供的方法不局限于医学场景中的三维医学图像序列,亦可以应用到自然场景中的视频数据。下面结合图1至图8详细介绍本申请实施例提及的模型训练方法和图像识别方法。

图1所示为本申请一实施例提供的模型训练方法的流程示意图。如图1所示,本申请实施例提供的模型训练方法包括如下步骤。

步骤S200,基于M幅图像各自对应的第一类别分配权重数据训练第一识别模型,得到第二识别模型。其中,M幅图像属于待识别图像序列样本,M幅图像对应N个类别,M和N均为大于1的正整数。

示例性地,M幅图像对应N个类别的含义是,待识别图像序列样本共涉及N个类别(比如N个部位类别),那么,M幅图像中的每幅图像均属于N个类别中的其中一个类别。

示例性地,图像对应的类别分配权重数据表征的是,根据图像对于模型来说的实际学习难度,为图像分配的能够表征学习难易的类别分配权重数据。对应地,步骤S200中提及的第一类别分配权重数据指的是图像对应的初始类别分配权重数据。在一些实施例中,在模型开始训练之前,因不知M幅图像各自对于模型来说的实际学习难度,所以为M幅图像各自分配一统一的初始类别分配权重数据。

虽然步骤S200提及的是基于M幅图像各自对应的第一类别分配权重数据训练第一识别模型,但是可以理解,训练第一识别模型也需要待识别图像序列样本的一些必要数据。比如,在一些实施例中,上述提及的待识别图像序列样本包括至少一个CT图像序列,针对每个CT图像序列中的每幅图像,均用x(series, slice, data, gt, a, w)表示。其中,series表示该CT图像序列的序列id,slice表示该幅图像在该CT图像序列中的id,data表示该幅图像的图像像素数据,gt表示该幅图像的真实标签(即下述提及的类别标签数据),a表示该幅图像对应类别的类别权重,w表示该幅图像在训练中的再分配难易权重(即类别分配权重数据),初始值为1(即第一类别分配权重数据为1)。

示例性地,第一识别模型为建立的初始识别模型。在实际训练过程中,先将待识别图像序列样本中的M幅图像的顺序打乱,然后基于M幅图像各自对应的第一类别分配权重数据训练第一识别模型n轮,训练n轮后便可得到第二识别模型。也就是说,第二识别模型和第一识别模型的区别在于,一些具体的模型参数不同。值得注意的是,第二识别模型并非最终收敛的图像识别模型,仅仅是训练过程中得到的中间模型。此外,将M幅图像的顺序打乱的目的在于防止模型抖动,加快模型收敛。

在一些实施例中,判断模型是否收敛的条件为,模型的识别精度达到预设精度,并在多个迭代周期内没有超过波动阈值的波动。

在一些实施例中,第一识别模型为多分类卷积神经网络模型。因多分类卷积神经网络模型可通过层级转移学习,保存推理并在后续层级上进行新的学习,且在使用模型之前无需单独进行特征提取,因此,更适用于本申请的图像处理场景。

步骤S300,基于M幅图像各自对应的第一类别分配权重数据和第二识别模型,确定M幅图像各自对应的第二类别分配权重数据。

可以理解为,基于训练得到的第二识别模型修正M幅图像各自对应的第一类别分配权重数据,进而得到M幅图像各自对应的第二类别分配权重数据。

步骤S400,基于M幅图像各自对应的第二类别分配权重数据训练第二识别模型,得到图像识别模型。其中,图像识别模型用于确定待识别图像序列中的图像各自对应的类别识别结果。

示例性地,步骤S400中提及的图像识别模型为训练得到的、收敛的图像识别模型。

在实际应用过程中,首先基于包括M幅图像的待识别图像序列样本,确定M幅图像各自对应的第一类别分配权重数据,然后基于M幅图像各自对应的第一类别分配权重数据训练第一识别模型,得到第二识别模型,继而基于M幅图像各自对应的第一类别分配权重数据和第二识别模型,确定M幅图像各自对应的第二类别分配权重数据,并基于M幅图像各自对应的第二类别分配权重数据训练第二识别模型,得到图像识别模型。

本申请实施例提供的模型训练方法,考虑到图像样本相对于模型的学习难易问题,基于M幅图像各自对应的第一类别分配权重数据(又可称为初始类别分配权重数据)训练初始识别模型(可以是第一识别模型),并且,利用训练中途得到的中间模型(可以是第二识别模型)修正待识别图像序列样本中的图像各自对应的第一类别分配权重数据,得到待识别图像序列样本中的图像各自对应的第二类别分配权重数据,并利用待识别图像序列样本中的图像各自对应的第二类别分配权重数据继续训练中间模型,以得到收敛的图像识别模型。如此设置,本申请实施例能够为错误预测的图像样本重新定义其学习难易权重,进而使模型更多关注到错误预测的图像样本,极大提高训练得到的图像识别模型的识别精准度。

进一步地,在图1所示实施例的基础上延伸出本申请另一实施例。具体地,在本申请实施例中,在步骤S200之前,还需执行步骤:基于包括M幅图像的待识别图像序列样本,确定M幅图像各自对应的第一类别分配权重数据。也就是说,在步骤S200之前,还需执行分别为M幅图像赋予第一类别分配权重数据,即确定M幅图像各自对应的第一类别分配权重数据的步骤。

示例性地,在一些实施例中,第一识别模型中使用的损失函数如下述公式(1)所示。

(1)

在公式(1)中,表示当前图像对应的类别权重,表示预测概率,表示难易权重(即根据图像实际情况确定的常规难易权重),表示再分配难易权重(即上述实施例提及的类别分配权重数据)。

图2所示为本申请一实施例提供的确定M幅图像各自对应的第二类别分配权重数据的流程示意图。在图1所示实施例基础上延伸出图2所示实施例,下面着重叙述图2所示实施例与图1所示实施例的不同之处,相同之处不再赘述。

如图2所示,在本申请实施例中,基于M幅图像各自对应的第一类别分配权重数据和第二识别模型,确定M幅图像各自对应的第二类别分配权重数据步骤,包括如下步骤。

步骤S310,利用第二识别模型,确定M幅图像各自对应的第一类别识别结果。

步骤S320,基于M幅图像各自对应的类别标签数据和M幅图像各自对应的第一类别识别结果,更新M幅图像各自对应的第一类别分配权重数据,得到M幅图像各自对应的第二类别分配权重数据。

可以理解,即使第二识别模型作为中间模型未完全收敛,其也能够输出类别识别结果(即第一类别识别结果)。那么,针对M幅图像中的每幅图像,将该图像对应的类别标签数据和第一类别识别结果作比较,便可验证第一类别识别结果是否正确。

基于此,便可根据M幅图像各自对应的第一类别识别结果是否正确的情况,更新M幅图像各自对应的第一类别分配权重数据,得到M幅图像各自对应的第二类别分配权重数据。示例性地,增大第一类别识别结果错误的图像对应的第一类别分配权重数据,第一类别识别结果正确的图像对应的第一类别分配权重数据保持不变,进而得到M幅图像各自对应的第二类别分配权重数据。

本申请实施例提供的模型训练方法,能够利用训练得到的中间模型的识别结果修正更新待识别图像序列样本中的图像各自对应的类别分配权重数据,进而基于修正更新后的类别分配权重数据进一步训练中间模型,得到识别精准度更高的图像识别模型。

图3所示为本申请一实施例提供的更新M幅图像各自对应的第一类别分配权重数据,得到M幅图像各自对应的第二类别分配权重数据的流程示意图。在图2所示实施例基础上延伸出图3所示实施例,下面着重叙述图3所示实施例与图2所示实施例的不同之处,相同之处不再赘述。

如图3所示,在本申请实施例中,基于M幅图像各自对应的类别标签数据和M幅图像各自对应的第一类别识别结果,更新M幅图像各自对应的第一类别分配权重数据,得到M幅图像各自对应的第二类别分配权重数据步骤,包括如下步骤。

步骤S321,基于M幅图像各自对应的类别标签数据和M幅图像各自对应的第一类别识别结果,确定M幅图像中的P幅待增权图像。其中,待增权图像包括类别识别错误的图像,P为正整数。

在一些实施例中,待增权图像可被视为困难样本,需要增加权重以便模型重点学习。即,类别识别错误的图像被视为困难样本。

步骤S322,增量更新P幅待增权图像各自对应的第一类别分配权重数据,得到P幅待增权图像各自对应的第二类别分配权重数据。

示例性地,步骤S322中提及的增量更新指的是,增大P幅待增权图像各自对应的第一类别分配权重数据,进而更新得到P幅待增权图像各自对应的第二类别分配权重数据。

步骤S323,基于P幅待增权图像各自对应的第二类别分配权重数据,得到M幅图像各自对应的第二类别分配权重数据。

本申请实施例提供的模型训练方法,通过增量更新P幅待增权图像各自对应的第一类别分配权重数据的方式,增大了困难样本在模型训练过程中的贡献,提高模型对其的注意力,从而很好地克服困难样本难学习的问题。此外,由于样本较少的数据在学习过程中也可也当作困难样本看待,因此,本申请实施例也能够变相解决类别不均衡问题。

图4所示为本申请一实施例提供的增量更新P幅待增权图像各自对应的第一类别分配权重数据,得到P幅待增权图像各自对应的第二类别分配权重数据的流程示意图。在图3所示实施例基础上延伸出图4所示实施例,下面着重叙述图4所示实施例与图3所示实施例的不同之处,相同之处不再赘述。

如图4所示,在本申请实施例中,增量更新P幅待增权图像各自对应的第一类别分配权重数据,得到P幅待增权图像各自对应的第二类别分配权重数据步骤,包括如下步骤。

步骤S3221,基于P幅待增权图像各自对应的类别标签数据,确定P幅待增权图像和N个类别之间的从属关系。

步骤S3222,基于从属关系,将P幅待增权图像划分为Q个连续图像子序列。

示例性地,基于从属关系,将P幅待增权图像划分为Q个连续图像子序列的具体实现方式为,将从属于同一类别且连续的待增权图像划分为一个连续图像子序列。

步骤S3223,针对Q个连续图像子序列中的每个连续图像子序列,增量更新连续图像子序列中的待增权图像各自对应的第一类别分配权重数据,得到连续图像子序列中的待增权图像各自对应的第二类别分配权重数据。

也就是说,本申请实施例能够在充分顾及待增权图像所属的类别的基础上,确定待增权图像对应的第二类别分配权重数据。具体地,本申请实施例针对基于从属关系划分得到的每一连续图像子序列,独立增量更新该连续图像子序列中的图像各自对应的第一类别分配权重数据,从而得到更精准、细粒度更高的第二类别分配权重数据,进而为训练得到识别精准度更高的图像识别模型提供了前提条件。

下面结合图5进一步举例说明,步骤S3223的具体实现方式。

图5所示为本申请一实施例提供的增量更新连续图像子序列中的待增权图像各自对应的第一类别分配权重数据,得到连续图像子序列中的待增权图像各自对应的第二类别分配权重数据的流程示意图。在图4所示实施例基础上延伸出图5所示实施例,下面着重叙述图5所示实施例与图4所示实施例的不同之处,相同之处不再赘述。

如图5所示,在本申请实施例中,增量更新连续图像子序列中的待增权图像各自对应的第一类别分配权重数据,得到连续图像子序列中的待增权图像各自对应的第二类别分配权重数据步骤,包括如下步骤。

步骤S32231,基于连续图像子序列的图像数量信息,确定连续图像子序列中的待增权图像各自对应的增量权重数据。

示例性地,若是基于连续图像子序列的图像数量信息,确定连续图像子序列中的图像数量小于预设图像数量,则可视为连续图像子序列中的图像数量过少。在该种情况下,可无需考虑图像之间的时序序列特征,比如设定连续图像子序列中的待增权图像各自对应的增量权重数据相同。

对应地,若是基于连续图像子序列的图像数量信息,确定连续图像子序列中的图像数量大于或等于预设图像数量,则可视为连续图像子序列中的图像数量比较多。在该种情况下,可在考虑图像之间的时序序列特征的前提下,设定连续图像子序列中的待增权图像各自对应的增量权重数据,比如设定连续图像子序列中的待增权图像各自对应的增量权重数据基于时序序列线性递增或线性递减。

步骤S32232,基于连续图像子序列中的待增权图像各自对应的增量权重数据和第一类别分配权重数据,得到连续图像子序列中的待增权图像各自对应的第二类别分配权重数据。

示例性地,针对连续图像子序列中的每幅待增权图像,将该幅待增权图像对应的第一类别分配权重数据和增量权重数据相加求和,以得到该幅待增权图像对应的第二类别分配权重数据。

本申请实施例充分考虑了连续图像子序列的实际情况,继而得到了与待增权图像更匹配的第二类别分配权重数据,从而为后续训练得到高精度的图像识别模型提供了数据基础。

图6所示为本申请一实施例提供的确定连续图像子序列中的待增权图像各自对应的增量权重数据的流程示意图。在图5所示实施例基础上延伸出图6所示实施例,下面着重叙述图6所示实施例与图5所示实施例的不同之处,相同之处不再赘述。

如图6所示,在本申请实施例中,基于连续图像子序列的图像数量信息,确定连续图像子序列中的待增权图像各自对应的增量权重数据步骤,包括如下步骤。

步骤S331,基于图像数量信息确定连续图像子序列的图像数量是否小于预设图像数量。

示例性地,在实际应用过程中,如果步骤S331的判断结果为否,即,连续图像子序列的图像数量大于或等于预设图像数量,则执行步骤S333和步骤S334。如果步骤S331的判断结果为是,即,连续图像子序列的图像数量小于预设图像数量,则执行步骤S332。

步骤S332,基于连续图像子序列的序列位置信息,确定连续图像子序列的起始端待增权图像。其中,起始端待增权图像为最靠近连续图像子序列所属的类别的序列边缘的待增权图像。

步骤S333,以起始端待增权图像为增量起点,基于预设最大增量值以线性减小的方式,确定连续图像子序列中的待增权图像各自对应的增量权重数据。

步骤S334,基于预设最小增量值,确定连续图像子序列中的待增权图像各自对应的增量权重数据。

下面结合表1进一步解释说明图6所示实施例。如表1所示,待识别图像序列样本共包括29幅图像,该29幅图像对应的序列信息(又称为序列位置信息)为1至29。为方便描述,下述直接以图像+序列信息的形式表达各图像。类别标签数据指的是图像的真实类别信息,共包括四个类别,为类别1至4。第一类别识别结果指的是利用中间模型(比如第二识别模型)得到的图像的类别识别结果。第一类别分配权重数据指的是未更新前的类别分配权重数据(可以为上述提及的第一类别分配权重数据)。第一类别分配权重数据指的是更新后的类别分配权重数据(可以为第二类别分配权重数据)。

表1 类别分配权重数据对比表

通过比对类别标签数据和第一类别识别结果可得知,图像3、图像4、图像8至图像12、图像21至图像26的类别识别错误(即为待增权图像)。在更新前,图像1至图像29各自对应的类别分配权重数据均为1。通过上述实施例对于连续图像子序列的介绍可知,图像3和图像4属于同一连续图像子序列(可称为第一连续图像子序列),图像8至图像12属于同一连续图像子序列(可称为第二连续图像子序列),图像21至图像26属于同一连续图像子序列(可称为第三连续图像子序列)。

在本申请实施例中,预设图像数量为3幅,预设最小增量值为0.1,预设最大增量值为1。那么,因第一连续图像子序列的图像数量为2幅(小于3幅),因此,为图像3和图像4的类别分配权重分别增加0.1,即,更新后,图像3和图像4各自对应的第二类别分配权重数据均为1.1。因第二连续图像子序列的图像数量为5幅(大于3幅),且图像12为起始端待增权图像,因此,以图像12为增量起点(即增加1),图像8为增量终点(即增加0.1),以线性减小的方式,确定图像12至图像8各自对应的增量权重数据,即,更新后,图像8至图像12对应的第二类别分配权重数据为1.1,1.325,1.55,1.775和2。第三连续图像子序列的计算方式与第二连续图像子序列类似,不再赘述。

相对来说,越靠近所属类别的边缘的待增权图像,越难以被模型很好地学习。因此,本申请实施例为最靠近连续图像子序列所属的类别的序列边缘的待增权图像赋予预设最大增量值,以便模型能够很好地学习该待增权图像的特征。此外,本申请实施例利用线性递减的方式为连续图像子序列中的其他待增权图像赋予权重增量值,进而使连续图像子序列中的待增权图像各自对应的增量权重数据充分顾及了连续图像子序列的时序序列特征,提高了连续图像子序列中的待增权图像各自对应的增量权重数据的合理性。

图7所示为本申请一实施例提供的基于M幅图像各自对应的第二类别分配权重数据训练第二识别模型,得到图像识别模型的流程示意图。在图1所示实施例基础上延伸出图7所示实施例,下面着重叙述图7所示实施例与图1所示实施例的不同之处,相同之处不再赘述。

如图7所示,在本申请实施例中,基于M幅图像各自对应的第二类别分配权重数据训练第二识别模型,得到图像识别模型步骤,包括如下步骤。

步骤S410,基于M幅图像各自对应的第二类别分配权重数据训练第二识别模型,得到第三识别模型。

步骤S420,利用第三识别模型,确定M幅图像各自对应的第二类别识别结果。

步骤S430,基于M幅图像各自对应的类别标签数据和M幅图像各自对应的第二类别识别结果,得到M幅图像各自对应的当前类别分配权重数据。

步骤S440,基于M幅图像各自对应的第一类别分配权重数据、第二类别分配权重数据和当前类别分配权重数据,确定M幅图像各自对应的第三类别分配权重数据。

示例性地,针对M幅图像中的每幅图像,该图像对应的第三类别分配权重数据,是通过对该图像对应的第一类别分配权重数据、第二类别分配权重数据和当前类别分配权重数据进行指数移动平均计算的方式得到的。换句话说,该图像对应的第三类别分配权重数据,是通过对该图像对应的历史类别分配权重数据进行指数移动平均计算的方式得到的。

示例性地,基于下述公式(2)进行指数移动平均计算。其中,表示计算得到的当前训练轮次的最终类别分配权重数据,的取值可根据实际确定,比如

(2)

步骤S450,基于M幅图像各自对应的第三类别分配权重数据训练第三识别模型,得到图像识别模型。

本申请实施例能够防止再分配权重时训练轮次的随机性对权重分配的影响,进而提高所得到的图像识别模型的鲁棒性。

需要说明的是,在实际应用过程中,步骤S450的具体实现方式可以为,再得到第四识别模型、第五识别模型等等,然后不断利用得到的中间模型修正M幅图像各自对应的类别分配权重数据,直至得到收敛的图像识别模型。

示例性地,在一些实施例中,基于M幅图像各自对应的第二类别分配权重数据训练第二识别模型,得到图像识别模型,包括:基于M幅图像各自对应的第二类别分配权重数据训练第二识别模型,得到第四识别模型;基于M幅图像各自对应的第二类别分配权重数据和第四识别模型,确定M幅图像各自对应的第四类别分配权重数据;基于M幅图像各自对应的第四类别分配权重数据训练第四识别模型,得到第五识别模型;基于M幅图像各自对应的第四类别分配权重数据和第五识别模型,得到第六识别模型;重复执行基于当前训练轮次开始前得到的类别分配权重数据训练当前训练轮次的模型以得到新的模型,并基于新的模型确定下一训练轮次开始前得到的类别分配权重数据的步骤,直至得到收敛的新的模型,将收敛的新的模型确定为所述图像识别模型。

本领域技术人员可以毫无疑义地理解,在本申请实施例中,上述提及的基于M幅图像各自对应的第二类别分配权重数据训练第二识别模型,得到第四识别模型;基于M幅图像各自对应的第二类别分配权重数据和第四识别模型,确定M幅图像各自对应的第四类别分配权重数据的步骤,属于基于当前训练轮次开始前得到的类别分配权重数据训练当前训练轮次的模型以得到新的模型,并基于新的模型确定下一训练轮次开始前得到的类别分配权重数据的步骤。

图8所示为本申请一实施例提供的图像识别方法的流程示意图。如图8所示,本申请实施例提供的图像识别方法包括如下步骤。

步骤S500,确定图像识别模型。

示例性地,图像识别模型基于上述实施例提及的模型训练方法训练得到。

步骤S600,利用图像识别模型,确定待识别图像序列中的图像各自对应的类别识别结果。

示例性地,待识别图像序列为三维医学图像序列,对应地,类别识别结果为部位识别结果。

本申请实施例利用图像识别模型,实现了精准地确定待识别图像序列中的图像各自对应的类别识别结果的目的。

上文结合图1至图8,详细描述了本申请的方法实施例,下面结合图9至图11,详细描述本申请的装置实施例。应理解,方法实施例的描述与装置实施例的描述相互对应,因此,未详细描述的部分可以参见前面方法实施例。

图9所示为本申请一实施例提供的模型训练装置的结构示意图。如图9所示,本申请实施例提供的模型训练装置包括第一训练模块200、第二确定模块300和第二训练模块400。具体地,第一训练模块200用于基于M幅图像各自对应的第一类别分配权重数据训练第一识别模型,得到第二识别模型。第二确定模块300用于基于M幅图像各自对应的第一类别分配权重数据和第二识别模型,确定M幅图像各自对应的第二类别分配权重数据。第二训练模块400用于基于M幅图像各自对应的第二类别分配权重数据训练第二识别模型,得到图像识别模型。

在一些实施例中,模型训练装置还包括第一确定模块,第一确定模块用于基于包括M幅图像的待识别图像序列样本,确定M幅图像各自对应的第一类别分配权重数据。

在一些实施例中,第二确定模块300还用于,利用第二识别模型,确定M幅图像各自对应的第一类别识别结果,基于M幅图像各自对应的类别标签数据和M幅图像各自对应的第一类别识别结果,更新M幅图像各自对应的第一类别分配权重数据,得到M幅图像各自对应的第二类别分配权重数据。

在一些实施例中,第二确定模块300还用于,基于M幅图像各自对应的类别标签数据和M幅图像各自对应的第一类别识别结果,确定M幅图像中的P幅待增权图像,增量更新P幅待增权图像各自对应的第一类别分配权重数据,得到P幅待增权图像各自对应的第二类别分配权重数据,基于P幅待增权图像各自对应的第二类别分配权重数据,得到M幅图像各自对应的第二类别分配权重数据。

在一些实施例中,第二确定模块300还用于,基于P幅待增权图像各自对应的类别标签数据,确定P幅待增权图像和N个类别之间的从属关系,基于从属关系,将P幅待增权图像划分为Q个连续图像子序列,针对Q个连续图像子序列中的每个连续图像子序列,增量更新连续图像子序列中的待增权图像各自对应的第一类别分配权重数据,得到连续图像子序列中的待增权图像各自对应的第二类别分配权重数据。

在一些实施例中,第二确定模块300还用于,基于连续图像子序列的图像数量信息,确定连续图像子序列中的待增权图像各自对应的增量权重数据,基于连续图像子序列中的待增权图像各自对应的增量权重数据和第一类别分配权重数据,得到连续图像子序列中的待增权图像各自对应的第二类别分配权重数据。

在一些实施例中,第二确定模块300还用于,基于图像数量信息确定连续图像子序列的图像数量是否小于预设图像数量。若是连续图像子序列的图像数量大于或等于预设图像数量,则基于连续图像子序列的序列位置信息,确定连续图像子序列的起始端待增权图像,以起始端待增权图像为增量起点,基于预设最大增量值以线性减小的方式,确定连续图像子序列中的待增权图像各自对应的增量权重数据。若是连续图像子序列的图像数量小于预设图像数量,则基于预设最小增量值,确定连续图像子序列中的待增权图像各自对应的增量权重数据。

在一些实施例中,第二训练模块400还用于,基于M幅图像各自对应的第二类别分配权重数据训练第二识别模型,得到第三识别模型,利用第三识别模型,确定M幅图像各自对应的第二类别识别结果,基于M幅图像各自对应的类别标签数据和M幅图像各自对应的第二类别识别结果,得到M幅图像各自对应的当前类别分配权重数据,基于M幅图像各自对应的第一类别分配权重数据、第二类别分配权重数据和当前类别分配权重数据,确定M幅图像各自对应的第三类别分配权重数据,基于M幅图像各自对应的第三类别分配权重数据训练第三识别模型,得到图像识别模型。

图10所示为本申请一实施例提供的图像识别装置的结构示意图。如图10所示,本申请实施例提供的图像识别装置包括模型确定模块500和识别结果确定模块600。具体地,模型确定模块500用于确定图像识别模型。识别结果确定模块600用于利用图像识别模型,确定待识别图像序列中的图像各自对应的类别识别结果。

下面,参考图11来描述根据本申请实施例的电子设备。图11所示为本申请一实施例提供的电子设备的结构示意图。

如图11所示,电子设备70包括一个或多个处理器710和存储器720。

处理器710可以是中央处理单元(Central Processing Unit,CPU)或者具有数据处理能力和/或指令执行能力的其他形式的处理单元,并且可以控制电子设备70中的其他组件以执行期望的功能。

存储器720可以包括一个或多个计算机程序产品,计算机程序产品可以包括各种形式的计算机可读存储介质,例如易失性存储器和/或非易失性存储器。易失性存储器例如可以包括随机存取存储器(Random Access Memory,RAM)和/或高速缓冲存储器(cache)等。非易失性存储器例如可以包括只读存储器(Read-Only Memory,ROM)、硬盘、闪存等。在计算机可读存储介质上可以存储一个或多个计算机程序指令,处理器710可以运行程序指令,以实现上文提及的本申请的各个实施例的模型训练方法、图像识别方法以及/或者其他期望的功能。在计算机可读存储介质中还可以存储诸如待识别图像序列样本等各种内容。

在一个示例中,电子设备70还可以包括:输入装置730和输出装置740,这些组件通过总线系统和/或其他形式的连接机构(未示出)互连。

该输入装置730可以包括例如键盘、鼠标等等。

该输出装置740可以向外部输出各种信息,包括类别识别结果等。该输出装置740可以包括例如显示器、扬声器、打印机、以及通信网络及其所连接的远程输出设备等等。

当然,为了简化,图11中仅示出了该电子设备70中与本申请有关的组件中的一些,省略了诸如总线、输入/输出接口等等的组件。除此之外,根据具体应用情况,电子设备70还可以包括任何其他适当的组件。

除了上述方法和设备以外,本申请的实施例还可以是计算机程序产品,其包括计算机程序指令,计算机程序指令在被处理器运行时使得处理器执行本说明书上述描述的根据本申请各种实施例的模型训练方法、图像识别方法中的步骤。

计算机程序产品可以以一种或多种程序设计语言的任意组合来编写用于执行本申请实施例操作的程序代码,程序设计语言包括面向对象的程序设计语言,诸如Java、C++等,还包括常规的过程式程序设计语言,诸如“C”语言或类似的程序设计语言。程序代码可以完全地在用户计算设备上执行、部分地在用户设备上执行、作为一个独立的软件包执行、部分在用户计算设备上部分在远程计算设备上执行、或者完全在远程计算设备或服务器上执行。

此外,本申请的实施例还可以是计算机可读存储介质,其上存储有计算机程序指令,计算机程序指令在被处理器运行时使得处理器执行本说明书上述描述的根据本申请各种实施例的模型训练方法、图像识别方法中的步骤。

计算机可读存储介质可以采用一个或多个可读介质的任意组合。可读介质可以是可读信号介质或者可读存储介质。可读存储介质例如可以包括但不限于电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。可读存储介质的更具体的例子(非穷举的列表)包括:具有一个或多个导线的电连接、便携式盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(Erasable Programmable Read-OnlyMemory,EPROM或闪存)、光纤、便携式紧凑盘只读存储器(Compact Disc Read-OnlyMemory,CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。

以上结合具体实施例描述了本申请的基本原理,但是,需要指出的是,在本申请中提及的优点、优势、效果等仅是示例而非限制,不能认为这些优点、优势、效果等是本申请的各个实施例必须具备的。另外,上述公开的具体细节仅是为了示例的作用和便于理解的作用,而非限制,上述细节并不限制本申请为必须采用上述具体的细节来实现。

本申请中涉及的器件、装置、设备、系统的方框图仅作为例示性的例子并且不意图要求或暗示必须按照方框图示出的方式进行连接、布置、配置。如本领域技术人员将认识到的,可以按任意方式连接、布置、配置这些器件、装置、设备、系统。诸如“包括”、“包含”、“具有”等等的词语是开放性词汇,指“包括但不限于”,且可与其互换使用。这里所使用的词汇“或”和“和”指词汇“和/或”,且可与其互换使用,除非上下文明确指示不是如此。这里所使用的词汇“诸如”指词组“诸如但不限于”,且可与其互换使用。

还需要指出的是,在本申请的装置、设备和方法中,各部件或各步骤是可以分解和/或重新组合的。这些分解和/或重新组合应视为本申请的等效方案。

提供所公开的方面的以上描述以使本领域的任何技术人员能够做出或者使用本申请。对这些方面的各种修改对于本领域技术人员而言是非常显而易见的,并且在此定义的一般原理可以应用于其他方面而不脱离本申请的范围。因此,本申请不意图被限制到在此示出的方面,而是按照与在此公开的原理和新颖的特征一致的最宽范围。

为了例示和描述的目的已经给出了以上描述。此外,此描述不意图将本申请的实施例限制到在此公开的形式。尽管以上已经讨论了多个示例方面和实施例,但是本领域技术人员将认识到其某些变型、修改、改变、添加和子组合。

完整详细技术资料下载
上一篇:石墨接头机器人自动装卡簧、装栓机
下一篇:一种基于联邦学习的卸载智能优化方法和系统

网友询问留言

已有0条留言

还没有人留言评论。精彩留言会获得点赞!

精彩留言,会给你点赞!