一种基于图像识别的目标物形状框选方法及终端
技术领域
本发明涉及图像处理
技术领域
,特别涉及一种基于图像识别的目标物形状框选方法及终端。背景技术
图像识别技术是人工智能的一个重要领域。它是指对图像进行对象识别,以识别各种不同模式的目标和对像的技术。
对于图像来说,每个物体所对应的图像都有其自己的特征,对于人类大脑来说,当视觉信息通过视网膜进入大脑时,视觉皮层将感觉输入转换成连贯的感知,这些连贯的感知可以理解为是物体的心理表征,并由大脑内的神经元进行不同的物体区分。
基于此,现有图像识别都是以方形框进行目标物的识别,在一些需要目标物识别之后进行贴图处理的场合,基于方形框所得到的最终目标框包含了除目标物之外的元素而导致贴图效果不理想。
发明内容
本发明所要解决的技术问题是:提供一种基于图像识别的目标物形状框选方法及终端,使得最终框选得到的目标框更加符合目标物的轮廓。
为了解决上述技术问题,本发明采用的技术方案为:
一种基于图像识别的目标物形状框选方法,包括:
步骤S1、获取待识别图像的拍摄角度,基于所述拍摄角度还原待识别目标物的成像形状;
步骤S2、采用滑动窗口对所述待识别图像进行分类识别,以得到置信度最大的检测框作为目标检测框之后,依据所述成像形状对所述目标检测框进行二次框选,以得到目标轮廓框;
步骤S3、标记并显示所述目标检测框和/或所述目标轮廓框。
为了解决上述技术问题,本发明采用的另一种技术方案为:
一种基于图像识别的目标物形状框选终端,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现以下步骤:
步骤S1、获取待识别图像的拍摄角度,基于所述拍摄角度还原待识别目标物的成像形状;
步骤S2、采用滑动窗口对所述待识别图像进行分类识别,以得到置信度最大的检测框作为目标检测框之后,依据所述成像形状对所述目标检测框进行二次框选,以得到目标轮廓框;
步骤S3、标记并显示所述目标检测框和/或所述目标轮廓框。
本发明的有益效果在于:一种基于图像识别的目标物形状框选方法及终端,通过获取待识别图像的拍摄角度,基于拍摄角度还原待识别目标物的成像形状,之后依据成像形状对目标检测框进行二次框选,以得到目标轮廓框;由此,通过拍摄角度以更好的还原出目标物在待识别图像中的形状,之后依据得到的成像形状进行二次框选,以使得最终框选得到的目标框更加符合目标物的轮廓。
附图说明
图1为本发明实施例的一种基于图像识别的目标物形状框选方法的流程示意图;
图2为本发明实施例的一种基于图像识别的目标物形状框选终端的结构示意图。
标号说明:
1、一种基于图像识别的目标物形状框选终端;2、处理器;3、存储器。
具体实施方式
为详细说明本发明的技术内容、所实现目的及效果,以下结合实施方式并配合附图予以说明。
请参照图1,一种基于图像识别的目标物形状框选方法,包括:
步骤S1、获取待识别图像的拍摄角度,基于所述拍摄角度还原待识别目标物的成像形状;
步骤S2、采用滑动窗口对所述待识别图像进行分类识别,以得到置信度最大的检测框作为目标检测框之后,依据所述成像形状对所述目标检测框进行二次框选,以得到目标轮廓框;
步骤S3、标记并显示所述目标检测框和/或所述目标轮廓框。
从上述描述可知,本发明的有益效果在于:通过获取待识别图像的拍摄角度,基于拍摄角度还原待识别目标物的成像形状,之后依据成像形状对目标检测框进行二次框选,以得到目标轮廓框;由此,通过拍摄角度以更好的还原出目标物在待识别图像中的形状,之后依据得到的成像形状进行二次框选,以使得最终框选得到的目标框更加符合目标物的轮廓。
进一步地,所述步骤S2中依据所述成像形状对所述目标检测框进行二次框选,以得到目标轮廓框具体包括以下步骤:
步骤S21、依据所述成像形状得到最大内切于所述目标检测框的第一轮廓框,并将所述第一轮廓框置于所述目标检测框的中心位置;
步骤S22、根据所述第一轮廓框在所述目标检测框的内切位置,确定所述第一轮廓框在所述目标检测框未进行垂直相切的所有间隔框边;
步骤S23、依次将所述第一轮廓框按照预设大小向着所述间隔框边进行移动,并在每一次移动之后都对移动后的实时轮廓进行置信度计算,从而得到所述第一轮廓框向着所有所述述间隔框边的移动过程中每一个所述实时轮廓的置信度;
步骤S24、将置信度最大的所述实时轮廓作为目标轮廓框。
从上述描述可知,对于现在的滑动窗口识别算法,基本上都能较为准确的框选出包围目标物的检测框,即目标物在目标检测框内,由此,基于最大内切于目标轮廓框的第一轮廓框来进行移动并进行置信度的计算,最后将置信度最大的实时轮廓作为目标轮廓框,使得最终得到的目标轮廓框内也包围了目标物,从而能准确的框选出符合目标物的轮廓。
进一步地,所述步骤S23具体包括以下:
步骤S231、依次将所述第一轮廓框按照预设大小向着所述间隔框边进行移动,并在每一次移动之后都对移动后的实时轮廓进行置信度计算;
步骤S232、按照预设顺序对其中一个所述间隔框边进行移动,若得到一第一实时轮廓的置信度比其前后预设次数内所得到的实时轮廓的置信度都要大时,则停止对当前这个所述间隔框边的移动,否则将这个间隔框边在移动过程中的置信度最大的所述实时轮廓作为所述第一实时轮廓;
步骤S233、若存在两个所述间隔框边,则以所述第一轮廓框的初始位置作为起点来执行所述步骤S231和所述步骤S232,直至所述第一轮廓框向着所有所述述间隔框边均完成移动和对应置信度的计算;
所述步骤S24具体包括以下:
将置信度最大的所述第一实时轮廓作为目标轮廓框。
从上述描述可知,对于置信度在前后多次都是最大的第一实时轮廓即可认为在往对应的间隔框边移动的这一方向上达到最佳,因此停止这一个方向的移动,从而在保证框选准确度的前提下减少计算量,缩短计算时间,以保证能进行实时的图片处理。
进一步地,所述步骤S24具体包括以下:
将置信度最大的所述实时轮廓进行等比例放大或缩小,并在比例变化过程中实时计算置信度,以将完成比例缩放过程中所得到的置信度最大的比例轮廓作为目标轮廓框。
从上述描述可知,基于最大内切形状所得到的置信度最大的实时轮廓再进行等比例放大或缩小,以保证最终得到的目标轮廓框尽可能减少无用信息,使其更加符合目标物的轮廓。
进一步地,所述预设次数为[2,4]。
请参照图2,一种基于图像识别的目标物形状框选终端,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现以下步骤:
步骤S1、获取待识别图像的拍摄角度,基于所述拍摄角度还原待识别目标物的成像形状;
步骤S2、采用滑动窗口对所述待识别图像进行分类识别,以得到置信度最大的检测框作为目标检测框之后,依据所述成像形状对所述目标检测框进行二次框选,以得到目标轮廓框;
步骤S3、标记并显示所述目标检测框和/或所述目标轮廓框。
从上述描述可知,本发明的有益效果在于:通过获取待识别图像的拍摄角度,基于拍摄角度还原待识别目标物的成像形状,之后依据成像形状对目标检测框进行二次框选,以得到目标轮廓框;由此,通过拍摄角度以更好的还原出目标物在待识别图像中的形状,之后依据得到的成像形状进行二次框选,以使得最终框选得到的目标框更加符合目标物的轮廓。
进一步地,所述步骤S2中依据所述成像形状对所述目标检测框进行二次框选,以得到目标轮廓框具体包括以下步骤:
步骤S21、依据所述成像形状得到最大内切于所述目标检测框的第一轮廓框,并将所述第一轮廓框置于所述目标检测框的中心位置;
步骤S22、根据所述第一轮廓框在所述目标检测框的内切位置,确定所述第一轮廓框在所述目标检测框未进行垂直相切的所有间隔框边;
步骤S23、依次将所述第一轮廓框按照预设大小向着所述间隔框边进行移动,并在每一次移动之后都对移动后的实时轮廓进行置信度计算,从而得到所述第一轮廓框向着所有所述述间隔框边的移动过程中每一个所述实时轮廓的置信度;
步骤S24、将置信度最大的所述实时轮廓作为目标轮廓框。
从上述描述可知,对于现在的滑动窗口识别算法,基本上都能较为准确的框选出包围目标物的检测框,即目标物在目标检测框内,由此,基于最大内切于目标轮廓框的第一轮廓框来进行移动并进行置信度的计算,最后将置信度最大的实时轮廓作为目标轮廓框,使得最终得到的目标轮廓框内也包围了目标物,从而能准确的框选出符合目标物的轮廓。
进一步地,所述步骤S23具体包括以下:
步骤S231、依次将所述第一轮廓框按照预设大小向着所述间隔框边进行移动,并在每一次移动之后都对移动后的实时轮廓进行置信度计算;
步骤S232、按照预设顺序对其中一个所述间隔框边进行移动,若得到一第一实时轮廓的置信度比其前后预设次数内所得到的实时轮廓的置信度都要大时,则停止对当前这个所述间隔框边的移动,否则将这个间隔框边在移动过程中的置信度最大的所述实时轮廓作为所述第一实时轮廓;
步骤S233、若存在两个所述间隔框边,则以所述第一轮廓框的初始位置作为起点来执行所述步骤S231和所述步骤S232,直至所述第一轮廓框向着所有所述述间隔框边均完成移动和对应置信度的计算;
所述步骤S24具体包括以下:
将置信度最大的所述第一实时轮廓作为目标轮廓框。
从上述描述可知,对于置信度在前后多次都是最大的第一实时轮廓即可认为在往对应的间隔框边移动的这一方向上达到最佳,因此停止这一个方向的移动,从而在保证框选准确度的前提下减少计算量,缩短计算时间,以保证能进行实时的图片处理。
进一步地,所述步骤S24具体包括以下:
将置信度最大的所述实时轮廓进行等比例放大或缩小,并在比例变化过程中实时计算置信度,以将完成比例缩放过程中所得到的置信度最大的比例轮廓作为目标轮廓框。
从上述描述可知,基于最大内切形状所得到的置信度最大的实时轮廓再进行等比例放大或缩小,以保证最终得到的目标轮廓框尽可能减少无用信息,使其更加符合目标物的轮廓。
进一步地,所述预设次数为[2,4]。
请参照图1,本发明的实施例一为:
一种基于图像识别的目标物形状框选方法,包括:
步骤S1、获取待识别图像的拍摄角度,基于拍摄角度还原待识别目标物的成像形状;
在本实施例中,对于特定的待识别目标物,通过一多分类的卷积神经网络模型进行角度识别,该卷积神经网络模型为根据待识别图像的来源进行不同的角度输出。
其中,若识别物体为球型,则基于任何角度得到的成像形状均为圆形则无需获取拍摄角度就可以直接得到待识别目标物的成像形状。
步骤S2、采用滑动窗口对待识别图像进行分类识别,以得到置信度最大的检测框作为目标检测框之后,依据成像形状对目标检测框进行二次框选,以得到目标轮廓框;
在本实施例中,步骤S2中依据成像形状对目标检测框进行二次框选,以得到目标轮廓框具体包括以下步骤:
步骤S21、依据成像形状得到最大内切于目标检测框的第一轮廓框,并将第一轮廓框置于目标检测框的中心位置;
即第一轮廓框至少有相对的两边是和目标检测框相切的,因为若只有一边相切,则说明还不是最大的内切形状。而若是相邻的两边相切,则两对相对边都没有相切,则往没有相切的方向移动一下又可以放大,因此,此时也不是最大的内切形状。即只包括相对两边相切、相对两边加相邻一边相切以及四边相切的情况。
步骤S22、根据第一轮廓框在目标检测框的内切位置,确定第一轮廓框在目标检测框未进行垂直相切的所有间隔框边;
其中,当为相对两边相切,假设是左右两边,则上下两边就是间隔框边。而如果是相对两边加相邻一边相切,假设为左右加上边,则下边为间隔框边。而如果是四边相切的情况,则没有间隔框边,忽略步骤S22。
步骤S23、依次将第一轮廓框按照预设大小向着间隔框边进行移动,并在每一次移动之后都对移动后的实时轮廓进行置信度计算,从而得到第一轮廓框向着所有述间隔框边的移动过程中每一个实时轮廓的置信度;
在本实施例中,步骤S23具体包括以下:
步骤S231、依次将第一轮廓框按照预设大小向着间隔框边进行移动,并在每一次移动之后都对移动后的实时轮廓进行置信度计算;
以上述的两边相切为例,第一轮廓框可以往上边移动,此时根据待识别图像的像素密度或者是用户自行设定的预设大小进行移动,比如10个像素。移动一次,得到一个对应的实时轮廓并实时进行置信度计算。
步骤S232、按照预设顺序对其中一个间隔框边进行移动,若得到一第一实时轮廓的置信度比其前后预设次数内所得到的实时轮廓的置信度都要大时,则停止对当前这个间隔框边的移动,否则将这个间隔框边在移动过程中的置信度最大的实时轮廓作为第一实时轮廓;
其中,预设次数为[2,4],在本实施例中为3。即加上前三次和后三次的置信度比较,都是第一实时轮廓的置信度最高,则无需再往上边移动
步骤S233、若存在两个间隔框边,则以第一轮廓框的初始位置作为起点来执行步骤S231和步骤S232,直至第一轮廓框向着所有述间隔框边均完成移动和对应置信度的计算;
即最多是两个相对的间隔框边,此时以第一轮廓框的初始位置开始移动,避免重复移动和计算带来的延时。
步骤S24、将置信度最大的第一实时轮廓作为目标轮廓框。
即对于两个相对的间隔框边,在往相对两边移动的过程中分别得到两个第一实时轮廓,则将其中的最大值作为目标轮廓框。
其中,步骤S24具体包括以下:
将置信度最大的实时轮廓进行等比例放大或缩小,并在比例变化过程中实时计算置信度,以将完成比例缩放过程中所得到的置信度最大的比例轮廓作为目标轮廓框。
步骤S3、标记并显示目标检测框和/或目标轮廓框。
即在本实施例中,可以只显示目标检测框或目标轮廓框,也可以两者一起显示,当为两者一起显示时,则以不同颜色进行区分显示或者以不同形式的线条进行区分,比如红色和绿色,比如实线和虚线。
请参照图2,本发明的实施例二为:
一种基于图像识别的目标物形状框选终端1,包括存储器3、处理器2及存储在存储器3上并可在处理器2上运行的计算机程序,处理器2执行计算机程序时实现上述实施例一的步骤。
综上所述,本发明提供的一种基于图像识别的目标物形状框选方法及终端,通过拍摄角度以更好的还原出目标物在待识别图像中的形状,之后依据得到的成像形状进行二次框选,并基于最大内切于目标轮廓框的第一轮廓框来进行移动并进行置信度的计算,最后将置信度最大的实时轮廓再进行等比例放大或缩小之后选定目标轮廓框,以使得最终框选得到的目标框更加符合目标物的轮廓。而对于置信度在前后多次都是最大的第一实时轮廓即可认为在往对应的间隔框边移动的这一方向上达到最佳,因此停止这一个方向的移动,从而在保证框选准确度的前提下减少计算量,缩短计算时间,以保证能进行实时的图片处理。
以上所述仅为本发明的实施例,并非因此限制本发明的专利范围,凡是利用本发明说明书及附图内容所作的等同变换,或直接或间接运用在相关的技术领域,均同理包括在本发明的专利保护范围内。
- 上一篇:石墨接头机器人自动装卡簧、装栓机
- 下一篇:一种基于多特征提取的药品标签数字识别方法