基于FF R-CNN钢材表面缺陷检测算法

韩 强1,张 喆1,续欣莹1,谢新林2

(1.太原理工大学 电气与动力工程学院,太原 030024;2.太原科技大学 先进控制与装备智能化山西省重点实验室,太原 030024)

摘 要:针对深度学习算法检测钢材表面缺陷时,结构信息减少导致检测精度低的问题,提出一种特征融合和级联检测网络的Faster R-CNN钢材表面缺陷检测算法。首先利用主干网络提取特征图,通过融合特征图的方式,达到减少结构信息丢失的目的;进一步将生成的特征图输入RPN网络生成区域建议框;最后利用检测网络对区域建议框进行分类与回归,通过级联2个检测网络,实现精确检测结果的目标。对模型进行对比性实验分析,找出检测精度最优的算法模型。在NEU-DET数据集上对提出的算法进行了检验,主干网络采用VGG-16比采用Resnet-50的检测精度提高了2.40%;通过融合特征,检测精度提高了11.86%;通过检测网络的级联,检测精度提高了2.37%.通过对算法模型的不断改进和优化,检测精度达到了98.29%.与传统的钢材表面检测方法相比,改进算法能够更准确地检测出钢材表面缺陷的种类和位置,提升对钢材表面缺陷的检测精度。

关键词:钢材表面缺陷检测;深度学习;Faster R-CNN;特征融合;级联检测网络

我国是全球第一钢铁生产大国,2019年全球粗钢产量18.7亿t,其中中国粗钢产量9.96亿t,占全球粗钢产量的53.3%.虽然中国粗钢产量占据全球粗钢产量的半壁江山,但是从钢铁行业的绩效水平看,中国企业与国际钢铁行业的平均水平还存在一定差距[1]。《中国制造2025》发展战略明确提出:着力发展智能装备和智能产品,推进生产过程智能化,培育新型生产方式,全面提升企业研发、生产、管理和服务的智能化水平[2]

目前,多数企业仍采用人工检测的方式检测缺陷。长期高强度的工作会影响检查员的工作状态,导致检查准确率低且出现遗漏。随着工业要求的提高和科学技术的发展,无损检测被广泛使用在各种材料的缺陷检测中,特别是金属材料。徐长航等[3]在含缺陷钢制试件红外热像检测实验的基础上,利用多种图像处理技术,实现了裂纹、圆孔等不同类型缺陷的提取与识别。张学武等[4]提出了一种基于红外成像的强反射金属表面缺陷视觉检测方法,利用CCD视觉传感器获取受检测金属表面的红外影像资料,对微小缺陷可达到92.8%的检测率和95.42%的识别率。JOUNG et al[5]将红外成像技术应用在管道缺陷的检测上。同时,基于机器视觉的图像处理方法也被广泛应用。董家顺等[6]利用一种改进K-means灰度正反求和的检测方法对钢管表面缺陷进行了检测。YOU et al[7]提出了一种可以从太赫兹成像系统获得的图像中准确提取缺陷轮廓的方法。JEON et al[8]提出了一种结合光照法的滤波方案,用于钢铁表面缺陷检测。SON et al[9]提出了一种测定钢桥表面锈蚀面积的方法,该方法包括:颜色空间转换、基于J48决策树算法的锈蚀区域分类。该方法对119个试件的锈蚀区域划分的平均准确率约为97.95%,整个处理过程平均只需0.57 s.LIAO et al[10]提出了一种由3种不同方法组成的图像自动处理算法,采用最小二乘支持向量机,对缺陷半径进行预测。王宇等[11]提出了一种利用机器视觉来检测金属零件表面缺陷的系统。这些基于机器视觉的图像处理方法在一定程度上提高了检测效率,满足了自动化的要求,但是适应性较差[12]

随着人工智能和大数据时代的到来,深度学习算法被越来越多地应用在缺陷检测中。因为深度学习算法具有准确性高、效率高、适应性强的特点,深度学习逐渐成为缺陷检测的重要研究方向。XU et al[13]使用基于机器视觉的方法来检测金属表面缺陷,可以在不均匀的光照条件下检测裂缝、凹痕甚至其他缺陷。黄凤荣等[14]提出了一种Faster R-CNN算法为框架的零件表面缺陷检测算法,并引入多级ROI池化层结构,该算法将缺陷检测的均值平均精度mAP从原算法的54.7%提高到97.9%,检测速度最快达到4.9 f/s(f表示帧数).SHEN et al[15]开发了一种机器视觉系统,适用于检测变形、腐蚀和划痕的轴承缺陷。HE et al[16]提出了一种新的物体检测框架分类优先网络(CPN)和一种新的分类网络多组卷积神经网络(MG-CNN)来检测钢材的表面缺陷,可以使带钢热轧表面缺陷的检测精度超过94%,分类率超过96%.YI et al[17]提出了基于深度卷积神经网络的端到端钢带表面缺陷检测方法。HE et al[18]将机器视觉应用于金属表面缺陷检测中,其缺陷分类任务的准确率可达到99.67%,缺陷检测任务的准确度可达到82.3%.李维刚等[19]针对热轧带钢表面缺陷检测中存在的检测速度慢、检测精度低等问题,提出了一种改进的YOLOv3算法模型。改进后的YOLOv3算法在NEU-DET数据集上平均精度均值达到了80%,较原有的YOLOv3算法提高了11%,实时检测速度保持在50 f/s(f表示帧数).汤勃等[20]针对小样本的钢板表面缺陷分类检测问题,提出基于卷积神经网络带标记的钢板表面缺陷检测系统。方叶祥等[21]提出了基于改进YOLOv3算法的实时缺陷检测方法,该方法对钢材表面的压痕与划痕的检测精度分别为92%和90%.代小红等[22]提出了一种基于改进RCNN的金属材料工件表面缺陷检测算法,在图像预处理过程中,运用了图像缺陷定位标注与图像数据的增强处理的方法,引入多级ROI池化层结构设计算法,实现高效并准确检测零件表面缺陷的目的,检测精度可达97.36%.方钧婷等[23]提出了一种基于注意力机制的级联网络缺陷检测算法,对金属表面缺陷进行高质量分类和定位。朱超平等[24]采用了改进型的Faster-RCNN目标检测算法,引入了深度生成式对抗网络,对汽车轮毂表面缺陷进行检测。尽管在金属缺陷检测中已经进行了许多相关研究,但是仍然存在精度低的问题。导致缺陷检测精度低的原因是多方面的,包括深度神经网络在检测时特征图中结构信息的减少。

针对深度神经网络在目标检测时特征图中结构信息减少的问题,本文提出一种基于特征融合和级联检测网络的Faster R-CNN(FF R-CNN)检测算法,以提高检测精度。FF R-CNN采用对特征图进行融合的方法,来减少特征图中结构信息的消失。通过对比多种融合方式对检测结果的影响,确定了检测精度最高的融合方式,并通过级联检测网络进一步提高算法的检测精度。在NEU-DET钢材缺陷样本数据集上进行缺陷检测实验,验证了FF R-CNN算法的可行性和有效性。

1 Faster R-CNN算法

1.1 Faster R-CNN网络结构

目前,深度神经网络对于目标的检测性能已得到证明。深度神经网络主要分为双阶段目标检测算法与单阶段目标检测算法。双阶段目标检测算法首先提取图像中的候选框,然后对候选框二次修正,得到精度较高的检测结果,但是检测速度慢;单阶段目标检测算法直接对图像进行计算,生成检测结果,检测速度快,但检测精度低。双阶段目标检测算法Faster R-CNN系列的深度神经网络,检测精度一般要优于单阶段目标检测算法SSD和YOLOv2[25].

Faster R-CNN网络结构如图1所示。

图1 Faster R-CNN网络结构
Fig.1 Faster R-CNN network structure

Faster R-CNN的网络结构可分为4个部分,即主干网络、RPN网络、ROI池化层以及分类回归网络。将这4部分按照功能划分,可分为特征提取部分,RPN网络与检测网络部分。特征提取部分为主干网络,检测网络包括ROI池化层以及分类回归网络。

Faster R-CNN通过主干网络提取图像的特征图,并且将特征图作为RPN网络和ROI池化层的输入;RPN网络生成区域建议框,通过边界框回归得到相对准确的区域建议框;ROI池化层将RPN网络生成的区域建议框与主干网络提取的特征图相结合,生成建议特征图,并且输入分类回归网络;分类回归网络对建议特征图进行缺陷分类与回归,得到区域建议框内目标的类别与准确位置。

1.2 主干网络

Faster R-CNN的主干网络可以是VGG-16,ResNet-50或其他特征提取网络。本文用VGG-16作为FF R-CNN的主干网络。VGG-16的网络结构如图2所示。

图2 VGG-16网络结构
Fig.2 VGG-16 network structure

VGG-16网络由13个卷积层,5个池化层和3个全连接层组成。在所有卷积层中,使用的卷积核为3×3,步长为1.池化层使用的池化核大小为2×2,步长为2.在所有的卷积层中,卷积操作不会改变输入矩阵的大小。而在所有的池化层中,池化操作会将输出矩阵的尺寸变为输入矩阵的二分之一。

对VGG-16的网络而言,可以将VGG-16的13个卷积层和5个池化层划分为不同的Block,从前到后依次编号为Block1-Block5.每个Block包含多个卷积层和一个池化层,并且在同一Block中,不同卷积层输出矩阵的大小相同。每个卷积层被称为conv3-X-Y,其中conv3表示卷积核大小为3×3,X为卷积层的通道数,Y为该卷积层的位置。例如:Block1包含2个卷积层(conv3-64-1,conv3-64-2),1个max池化层;Block3包含3个卷积层(conv3-256-1,conv3-256-2,conv3-256-3),1个max池化层;Block5包含3个卷积层(conv3-512-1,conv3-512-2,conv3-512-3),1个max池化层。

1.3 RPN网络

RPN网络是Faster R-CNN中最重要的改进。Faster R-CNN直接使用RPN生成区域建议框,这也是Faster R-CNN的巨大优势,能极大提升区域建议框的生成速度。

通过主干网络,Faster R-CNN网络提取图像的特征图。RPN网络对特征图进行处理,得到一个尺寸为m×n的特征图,对应将原图划分为m×n个区域,原图的每个区域的中心由这个特征图上的一个像素点坐标表示。通过锚点(anchor)机制,可以在每个像素点对应原图的区域生成k个可能存在目标的候选框。RPN就是用来判断每个像素点对应的k个区域是否包含目标,若包含目标,则修正区域建议框,并输入检测网络。

1.4 检测网络

检测网络包括ROI池化层以及分类回归网络。ROI池化层的主要作用是将主干网络提取出的特征图与RPN得到的区域建议框相结合,并将结合的特征图转换为7×7的恒定特征大小。将ROI池化层结合的特征向量输入到分类回归网络进行分类和回归,Faster R-CNN网络最终得到缺陷的精确位置和类型。

2 基于FF R-CNN钢材表面缺陷检测算法

对比传统的Faster R-CNN算法,FF R-CNN在特征提取部分和检测网络部分提出改进。在特征提取部分,使用VGG-16来提取钢材表面的图像特征,并且通过特征图的融合来减少特征图中结构信息的减少;在检测网络阶段,通过级联2个IOU阈值不同的检测网络进行目标的分类和定位,以提高检测精度。FF R-CNN网络结构如图3所示。

图3 FF R-CNN网络结构
Fig.3 FF R-CNN network structure

2.1 特征融合

VGG-16由卷积层、池化层和全连接层组成,用于提取图像特征。距离网络输入部分较近的特征图称为低层特征图,尺寸较大,结构信息准确,全局语义信息较弱,这样的特征有利于目标的定位,但不利于目标的分类。通过卷积与池化操作,主干网络逐渐减小了特征图的大小,这意味着通过卷积和池化获得的特征图的接受度也变得越来越大。距离网络输出部分越近的特征图称为高层特征图,尺寸较小,语义信息丰富,但结构信息有所减少,这样的特征图有利于目标的分类,但是不利于目标的定位。所以需要特征融合来保证特征图中的结构信息不被减少,使得分类任务与定位任务均能有更高的精度。

如图3所示,本文提出的FF R-CNN算法模型结构选择将Block3的conv3-256-1和conv3-256-3融合,融合为新的conv3-512-4;将Block5的conv3-512-1和conv3-512-3融合,融合为新的conv3-1024-4.通过特征融合,得到了同时具有低层结构信息和高层语义信息的特征图。表1为VGG-16与改进后主干网络的结构对比。

表1 VGG-16与改进后的主干网络结构对比
Table 1 Comparison of VGG-16 and improved
backbone network structure

编号VGG-16改进后的主干网络Block1conv3-64-1conv3-64-1conv3-64-2conv3-64-2maxpoolmaxpoolBlock2conv3-128-1conv3-128-1conv3-128-2conv3-128-2maxpoolmaxpoolBlock3conv3-256-1conv3-256-1conv3-256-2conv3-256-2conv3-256-3conv3-256-3conv3-512-4maxpoolmaxpoolBlock4conv3-512-1conv3-512-1conv3-512-2conv3-512-2conv3-512-3conv3-512-3maxpoolmaxpoolBlock5conv3-512-1conv3-512-1conv3-512-2conv3-512-2conv3-512-3conv3-512-3conv3-1024-4maxpoolmaxpool

2.2 级联检测网络

FF R-CNN在Faster R-CNN的检测网络后增加了一个IOU阈值更高的检测网络,并且将2个检测网络进行级联。检测网络以固定的IOU阈值训练后获得的边界框比输入建议框更准确,即边界框的IOU高于原始输入区域建议框[26]。同时,如果输入区域建议框的IOU接近于检测网络训练时设置的阈值,则模型对于目标的检测精度会更高。但是,在训练过程中盲目提高IOU阈值将导致负样本过多。该模型很难正确学习到真实的目标特征,并且容易发生拟合不足的问题。因此,盲目提高IOU阈值对模型的检测效果有负影响。

因此,FF R-CNN在检测网络部分级联两个检测网络D1-net和D2-net,并为D1-net和D2-net设置不同的IOU阈值。D1-net的IOU阈值为0.5,D2-net的IOU阈值为0.6.每个检测网络都是基于各自IOU阈值的正负样本训练得到。

FF R-CNN通过特征提取网络提取到特征图,之后由RPN网络生成区域建议框,将这些区域建议框与特征图结合送入IOU阈值为0.5的分类回归网络,得到经过修正的边界框,再将这些边界框送入IOU阈值为0.6的分类回归网络,得到更精确的边界框。

3 实验内容

为了验证FF R-CNN的有效性,本文在NEU-DET钢材表面缺陷样本数据集上进行了测试。

3.1 NEU-DET钢材表面缺陷样本数据集

NEU钢材表面缺陷样本数据集是缺陷分类数据集,包括裂纹、夹杂物、斑块、凹面、轧制氧化皮和划痕6种缺陷。每个缺陷类别包含300个图像。6种缺陷图像的示例如图4所示。

NEU表面缺陷数据集只能完成缺陷分类任务。为了使NEU表面缺陷数据集能够执行缺陷检测任务,NEU-DET钢材表面缺陷样本数据集提供了XML文件的注释。根据XML文件的注释,分类数据集将可以作为检测数据集使用。NEU-DET钢材表面缺陷样本数据集准确注释图像中每个缺陷的类型以及缺陷的左上角和右下角坐标,缺陷的边界框由左上角坐标和右下角坐标确定。

3.2 NEU-DET的缺陷检测

本文在NEU-DET钢材表面缺陷样本数据集上进行钢材表面缺陷检测实验。本文将NEU-DET钢材表面缺陷样本数据集分为训练集和测试集,训练集包含1 800张图像,测试集包含180张图像,在测试集中,6类缺陷均有30张图像。利用训练集,分别训练了Faster R-CNN,仅在主干网络部分进行特征融合的Faster R-CNN和FF R-CNN,并且在测试集上对3个网络的性能进行了验证。本文通过平均准确度(PA),评估了检测实验的结果,平均准确度能够综合考虑准确度(precision,P)和召回率(recall,R)两个重要检测指标。

(1)

(2)

(3)

式中:PTPFNF分别代表真阳性,假阳性和假阴性的数量。计算平均PA(PA,m)以评估整体性能,其计算公式为:

(4)

其中,Nc为检测缺陷的类别数。

实验的硬件环境为Intel Xeon E5-2620 CPU,NVIDIA TITAN Xp GPU,12GB显存。软件环境为CentOS 7,MX-NET架构,算法实现编程语言为Python.训练时设置学习率(Learning rate)为0.001,训练迭代次数为50次,Batch size取128.

图4 6种类型的缺陷图像示例
Fig.4 Examples of six types of defect image

3.3 消融实验

对Faster R-CNN、特征融合的Faster R-CNN与FF R-CNN做消融实验,实验结果如表2所示。Faster R-CNN的PA,m为84.06%,特征融合的Faster R-CNN的PA,m为95.92%,FF R-CNN的PA,m为98.29%.

表2 消融实验
Table 2 Ablation test

实验项Faster R-CNNFeature FusionFF R-CNNPA of crazing/%77.7795.01100.00PA of inclusion/%76.8389.5699.37PA of patches/%96.1097.4099.88PA of pitted/%78.64100.00100.00PA of rolled in scale/%84.10100.00100.00PA of scratches/%90.9193.5690.51PA,m/%84.0695.9298.29检测速度/(f·s-1)12.2312.4512.26

FF R-CNN提出的改进(特征融合和级联检测网络)均能使检测精度有明显的提高。通过特征融合,主干网络提取的特征图同时具有低层结构信息和高层语义信息,特征图包含了更多的图像特征,使得PA,m提高了11.86%.通过级联检测网络,第二个检测网络的IOU有所提高,因此检测精度更高,PA,m提高了2.37%.NEU-DET钢材表面缺陷样本数据集中的6类缺陷检测结果如图5所示。

图5 六类缺陷的检测结果
Fig.5 Test results of six kinds of defect

由图5可以看出,本文提出的FF R-CNN与特征融合后的Faster R-CNN检测效果均好于Faster R-CNN.其中,在裂纹、夹杂物、斑块、凹面与轧制氧化皮的缺陷检测中,FF R-CNN的检测精度明显高于Faster R-CNN.FF R-CNN与特征融合后的Faster R-CNN检测效果对比,在裂纹、夹杂物与斑块缺陷检测中,FF R-CNN的效果更好。在划痕检测中,特征融合后的Faster R-CNN的检测效果略优于FF R-CNN.

3.3.1主干网络

对VGG-16与ResNet-50做对比实验,实验结果如表3所示。

表3 主干网络
Table 3 Detection results of different backbone networks

测试项VGG-16ResNet-50PA of crazing/%77.7771.24PA of inclusion/%76.8382.59PA of patches/%96.1098.18PA of pitted/%78.6475.41PA of rolled in scale/%84.1074.09PA of scratches/%90.9189.66PA,m/%84.0681.86检测速度/(f·s-1)12.236.20

VGG-16的检测精度为84.06%,优于ResNet-50的81.86%.VGG-16每秒可处理12.23张缺陷图像,比ResNet-50更好。考虑到检测速度,本文选择VGG-16作为Faster R-CNN的主干网络。

3.3.2特征融合

确定了VGG-16作为主干网络,为了验证特征融合能够提高检测精度,并确定最优的特征融合方案。本文实验了多种特征融合方式,实验结果如表4所示。

表4 特征融合检测结果
Table 4 Detection results of different feature fusion stratogios

融合策略PA,m/%检测速度/(f·s-1)VGG-1684.0612.23策略A92.1812.42策略B95.9212.45策略C94.9812.40策略D94.6512.35

策略A选择将Block3中的conv3-256-1与conv3-256-3融合,Block4中的conv3-512-1与conv3-512-3融合,Block5中的conv3-512-1与conv3-512-3融合,PA,m可以提高8.12%;策略D选择将Block3中的conv3-256-1与conv3-256-3融合,Block4中的conv3-512-1与conv3-512-3融合,PA,m可以提高10.59%.策略C选择将Block4中的conv3-512-1与conv3-512-3融合,Block5中的conv3-512-1与conv3-512-3融合,PA,m可以提高10.92%.将Block3的conv3-256-1与conv3-256-3融合,Block5的conv3-512-1与conv3-512-3融合的策略B具有最佳的检测精度,PA,m可以提高11.86%.上述融合方法检测速度差异较小,Block3和Block5的特征融合策略的检测精度明显优于其他融合策略,可以实现最佳检测。

3.3.3级联检测网络

本文在进行特征融合后的Faster R-CNN后级联一个IOU阈值为0.6检测网络,构成了FF R-CNN.对经过训练后的FF R-CNN用测试集进行实验,实验结果见表5.与Faster R-CNN相比,FF R-CNN的检测精度得到了极大的提高。Faster R-CNN的PA,m为84.06%.通过特征融合,本文将PA,m提高了11.86%,提高至95.92%.加入级联检测网络后,本文的FF R-CNN将PA,m提高了2.37%,达到98.29%.

表5 级联IOU阈值检测结果
Table 5 Detection results of cascading IOU threshold

级联策略IOU阈值PA,m/%检测速度/(f·s-1)特征融合0.5--95.9212.45策略A0.5-0.797.6312.30策略B-0.60.797.9812.31策略C0.50.6-98.2912.26

表5表明,通过级联不同IOU阈值的检测网络,在一定程度上提高FF R-CNN算法模型在NEU-DET数据集上的[4]检测精度。策略A将IOU阈值为0.5的检测网络与IOU阈值为0.7的检测网络级联,可以将PA,m提升1.71%;策略C将IOU阈值为0.5的检测网络与IOU阈值为0.6的检测网络级联,可以将PA,m提升2.37%;策略B将IOU阈值为0.6的检测网络与IOU阈值为0.7的检测网络级联,可以将PA,m提升2.06%.通过对比可知策略C的检测精度优于其他级联策略。

检测网络的级联,增加了算法模型的复杂度,使得计算量增加,检测速度下降,但是下降的程度并不明显。在检测速度没有明显下降的情况下,FF R-CNN的检测精度提高了2.37%.通过实验结果可知,本文所提出的FF R-CNN可以大大提高NEU-DET钢材表面缺陷样本数据集的检测精度。部分检测实例如图6所示。

图6 部分检测实例
Fig.6 Test example

3.3.4与其他模型的比较

将本文的算法模型与Faster R-CNN,SSD,YOLOV3模型进行对比,结果如表6所示。从表中可知,Faster R-CNN与SSD,YOLOV3对比,在NEU-DET钢材表面缺陷样本数据集上,Faster R-CNN的检测精度为84.06%,要优于SSD的80.73%和YOLOV3的82.67%,但是SSD,YOLOV3的检测速度更快。本文提出的FF R-CNN算法模型在检测精度上明显优于SSD与YOLOV3,这表明本文提出的方法更适合应用在实际生产过程中。

表6 不同模型检测结果对比
Table 6 Comparison of test results of different models

模型PA,m/%检测速度/(f·s-1)Faster R-CNN84.0612.23SSD80.7325.14YOLOV382.6760.57FF R-CNN98.2912.26

4 结论

针对钢材表面缺陷检测的检测精度低的问题,本文提出了一种高检测精度的钢材表面缺陷检测算法,称为特征融合和级联检测网络的Faster R-CNN(FF R-CNN).在FF R-CNN中,对VGG-16特征提取网络进行了特征融合。通过实验对比,选择对Block3和Block5进行特征融合,使其对钢材表面缺陷具有更好的检测效果。另外,FF R-CNN在主干网络之后级联2个IOU阈值不同的检测网络,进一步提高算法的检测精度。在公共数据集NEU-DET上进行的实验表明,FF R-CNN在检测精度方面具有明显的优势,该算法将检测精度从Faster R-CNN算法的84.06%提高到98.29%,检测速度达到12.26 f/s,能够满足智能制造的生产需求,并且该算法模型还具有一定的泛化能力。虽然本文检测算法模型能够较好地完成钢材表面缺陷的检测任务,但是在检测速度上仍有提升的空间,接下来将对检测速度的提升做进一步的工作。

参考文献:

[1] 孟嘉乐,王兴艳.2019年中国钢铁行业绩效情况分析[J].冶金经济与管理,2020(6):9-12.

MENG J L,WANG X Y.Performance analysis of china steel industry in 2019[J].Metallurgical Economics and Management,2020(6):9-12.

[2] 周志超,张广治,王贵玉.智能制造在钢铁行业检测实验室中的应用探讨[J].中国检验检测,2020,28(6): 100-101.

ZHOU Z C,ZHANG G Z,WANG G Y.Discussion on application of intelligent manufacturing in testing laboratory of iron and steel industry[J].China Inspection Body & Laboratory,2020,28(6):100-101.

[3] 徐长航,陈国明,谢静.红外图像处理技术在金属表面缺陷检测中的应用[J].制造业自动化,2009,31(10):51-54.

XU C H,CHEN G M,XIE J.Application of infrared thermography technology in surface defects detection of products in metal[J].Manufacturing Automation,2009,31(10):51-54.

[4] 张学武,丁燕琼,闫萍.一种基于红外成像的强反射金属表面缺陷视觉检测方法[J].光学学报,2011,31(3):104-112.

ZHANG X W,DING Y Q,YAN P.Vision inspection of metal surface defects based on infrared imaging[J].Acta Optica Sinica,2011,31(3):104-112.

[5] JOUNG O J,KIM Y H.Application of an IR thermographic device for the detection of a simulated defect in a pipe[J].Sensors,2006,6(10):1199-1208.

[6] 董家顺,王兴东,李殿杰,等.基于改进K-means算法的钢管表面缺陷视觉检测方法[J].武汉科技大学学报,2020,43(6):439-446.

DONG J S,WANG X D,LI D J,et al.Visual inspection method for surface defects of steel pipes based on improvedK-means algorithm[J].Journal of Wuhan University of Science and Technology,2020,43(6):439-446.

[7] YOU C W,LU C C,WANG T Y,et al.Method for defect contour extraction in terahertz non-destructive testing conducted with a raster-scan THz imaging system[J].Applied Optics,2018,57(17):4884.

[8] JEON Y J,CHOI D,LEE S J,et al.Steel-surface defect detection using a switching-lighting scheme[J].Applied Optics,2016,55(1): 47-57.

[9] SON H,HWANG N,KIM C,et al.Rapid and automated determination of rusted surface areas of a steel bridge for robotic maintenance systems[J].Automation in Construction,2014,42(6):13-24.

[10] LIAO K W,LEE Y T.Detection of rust defects on steel bridge coatings via digital image recognition[J].Automation in Construction,2016,71(2):294-306.

[11] 王宇,吴智恒,邓志文,等.基于机器视觉的金属零件表面缺陷检测系统[J].机械工程与自动化,2018(4):210-211,214.

WANG Y,WU Z H,DENG Z W,et al.Metal component surface defect detection system based on machine vision[J].Mechanical Engineering & Automation,2018(4):210-211,214.

[12] 陶显,侯伟,徐德.基于深度学习的表面缺陷检测方法综述[J].自动化学报,2021,47(5):1017-1034.

TAO X,HOU W,XU D.A survey of surface defect detection methods based on deep learning[J].Acta Automatica Sinica,2021,47(5):1017-1034.

[13] XU K,LIU S,AI Y.Application of shearlet transform to classification of surface defects for metals[J].Image & Vision Computing,2015,35(3):23-30.

[14] 黄凤荣,李杨,郭兰申,等.基于Faster R-CNN的零件表面缺陷检测算法[J].计算机辅助设计与图形学学报,2020,32(6):30-40.

HUANG F R,LI Y,GUO L S,et al.Method for detecting surface defects of engine parts based on Faster R-CNN[J].Journal of Computer-aided Design & Computer Graphics,2020,32(6):30-40.

[15] SHEN H,LI S,GU D,et al.Bearing defect inspection based on machine vision[J].Measurement,2012,45(4):719-733.

[16] HE D,XU K,ZHOU P.Defect detection of hot rolled steels with a new object detection framework called classification priority network[J].Computers & Industrial Engineering,2019,128:290-297.

[17] YI L,LI G,JIANG M.An end-to-end steel strip surface defects recognition system based on convolutional neural networks[J].Steel Research International,2017,88(2):176-187.

[18] HE Y,SONG K,MENG Q,et al.An end-to-end steel surface defect detection approach via fusing multiple hierarchical features[J].IEEE Transactions on Instrumentation and Measurement,2019,69(4):1493-1504.

[19] 李维刚,叶欣,赵云涛,等.基于改进YOLOv3算法的带钢表面缺陷检测[J].电子学报,2020,48(7):1284-1292.

LI W G,YE X,ZHAO Y T,et al.Strip steel surface defect detection based on improved YOLOv3 algorithm[J].Acta Electronica Sinica,2020,48(7):1284-1292.

[20] 汤勃,戴超凡,黄文豪.基于卷积神经网络带标记的钢板表面缺陷检测[J].制造业自动化,2020,42(9):34-40.

TANG B,DAI C F,HAUNG W H.Detection and optimization of steel surface defects based on convolutional neural network[J].Manufacturing Automation,2020,42(9):34-40.

[21] 方叶祥,甘平,陈俐.金属表面缺陷检测的改进YOLOv3算法研究[J].机械科学与技术,2020,39(9):1390-1394.

FANG Y X,GAN P,CHEN L.Improved YOLOv3 algorithm for detection of metal surface defect[J].Mechanical Science and Technology for Aerospace Engineering,2020,39(9):1390-1394.

[22] 代小红,陈华江,朱超平.一种基于改进Faster RCNN的金属材料工件表面缺陷检测与实现研究[J].表面技术,2020,49(10):362-371.

DAI X H,CHEN H J,ZHU C P.Surface defect detection and realization of metal workpiece based on improved Faster RCNN[J].Surface Technology,2020,49(10):362-371.

[23] 方钧婷,谭晓阳.注意力级联网络的金属表面缺陷检测算法[J/OL].计算机科学与探索:1-11[2020-12-24].

FANG J T,TAN X Y.Defect detection of metal surface based on attention cascade R-CNN[J/OL].Journal of Frontiers of Computer Science and Technology:1-11[2020-12-24].

[24] 朱超平,杨永斌.基于改进的Faster-RCNN模型的汽车轮毂表面缺陷在线检测算法研究[J].表面技术,2020,49(6):359-365.

ZHU C P,YANG Y B.Online detection algorithm of automobile wheel surface defects based on improved Faster-RCNN model[J].Surface Technology,2020,49(6):359-365.

[25] GARG P,CHOWDHURY D R,MORE V N.Traffic sign recognition and classification using YOLOv2,faster RCNN and SSD[C]∥IEEE.2019 10th International Conference on Computing,Communication and Networking Technologies (ICCCNT).IEEE,2019.

[26] CAI Z,VASCONCELOS N.Cascade R-CNN:delving into high quality object detection[C]∥IEEE.Proceedings of the IEEE Conference on Computer Vision and Pattern Recognition,2018:6154-6162.

Steel Surface Defect Detection Based on FF R-CNN

HAN Qiang1, ZHANG Zhe1, XU Xinying1, XIE Xinlin2

(1.CollegeofElectricalandPowerEngineering,TaiyuanUniversityofTechnology,Taiyuan030024,China;2.KeyLabofAdvancedControlandIntelligentEquipmentofShanxi,TaiyuanUniversityofScienceandTechnology,Taiyuan030024,China)

Abstract:A Faster R-CNN steel surface defect detection algorithm based on feature fusion and cascade detection network was proposed to solve the problem of low detection accuracy caused by reduced structure information when Deep Learning algorithm was used to detect steel surface defects.The improved Faster R-CNN algorithm is used to detect surface defects of steel. First, the feature map is extracted from the main network and fused to reduce the loss of structural information; Then the resulting feature map is further input into the RPN network generation area recommendation box; Finally, the detection network is used to classify and regress the regional recommendation box, and two detection networks are cascaded to achieve the target of accurate detection results.The model was analyzed by comparative experiments to find the algorithm model with the best detection accuracy. The proposed algorithm was tested on the NEU-DET dataset. The detection mean average precision of the backbone network using VGG-16 is 2.40% higher than that using Resnet-50. By fusing the features, the detection mean average precisionis improved by 11.86%. By detecting the cascade of the network, the detection mean average precision is improved by 2.37%. By continuously improving and optimizing the algorithm model, the detection mean average precision reaches 98.29%. Compared with traditional steel surface detection methods, this algorithm can detect the types and locations of steel surface defects more accurately, and improve the detection accuracy of steel surface defects.

Keywords:surface defect detection of steel; deep learning; Faster R-CNN; feature fusion; cascade detection network

文章编号:1007-9432(2021)05-0754-10

收稿日期:2021-03-26

基金项目:山西省自然科学基金资助项目(201801D121144,201901D211079);先进控制与装备智能化山西省重点实验室开放课题基金资助(ACEI202101)

第一作者:韩强(1995-),硕士研究生,(E-mail)13934515804@163.com

通信作者:续欣莹(1979-),博士,教授,主要从事机器视觉与智能信息处理的研究,(E-mail)xuxinying@tyut.edu.cn

引文格式:韩强,张喆,续欣莹,等.基于FF R-CNN钢材表面缺陷检测算法[J].太原理工大学学报,2021,52(5):754-763.

中图分类号:TP183

文献标识码:A

DOI:10.16355/j.cnki.issn1007-9432tyut.2021.05.009

开放科学(资源服务)标识码(OSID):

(编辑:朱 倩)

Baidu
map