基于SA-TCN的轴承短期故障预测方法 - 太原理工大学党委宣传部

基于SA-TCN的轴承短期故障预测方法

王思远1,陈荣辉2,顾 凯3,任密蜂1,阎高伟1

(1.太原理工大学 电气与动力工程学院,太原 030024;2.台湾中原大学 化学工程学系,台湾 桃园 320-338;3. 中广核工程有限公司 核电安全监控技术与装备国家重点实验室,广东 深圳 518172)

摘 要:【目的】轴承是制造业中的核心零部件之一,其健康状况决定着主机设备的安全性,对轴承进行短期故障预测可以有效预防生产设备故障的发生。【方法】针对轴承短期故障预测未能实现端到端的问题,提出一种基于时序卷积网络(temporal convolutional network,TCN)的短期故障预测方法。该网络能通过当前时刻监测到的数据直接输出轴承最终会发生的故障类型以及下一时刻将要处于的劣化阶段。此外,提出软阈值注意力机制(soft threshold with attention mechanism,SA)解决轴承工作环境存在背景噪声或采集数据的过程中有噪声干扰的问题;在短期故障预测过程中,注意力机制根据TCN网络的预测目标自适应生成软阈值,软阈值作用于TCN提取到的时空特征,以达到降低噪声影响的目的。【结果】实验结果表明所提算法准确率高,具有较高的实际工程应用价值。

关键词:短期故障预测;时序卷积网络;轴承;注意力机制

中图分类号:TP183;TP206

文献标识码:A

DOI:10.16355/j.tyut.1007-9432.20230117

文章编号:1007-9432(2024)01-0214-09

引文格式:王思远,陈荣辉,顾凯,等.基于SA-TCN的轴承短期故障预测方法[J].太原理工大学学报,2024,55(1):214-222.

WANG Siyuan,CHEN Junghui,GU Kai,et al.Short-term fault prediction method for bearing based on SA-TCN[J].Journal of Taiyuan University of Technology,2024,55(1):214-222.

收稿日期:2023-03-06;

修回日期:2023-05-29

基金项目:山西省自然科学基金面上资助项目(20210302123189)

第一作者:王思远(1996-),硕士研究生,(E-mail)wangsiyuan0388@163.com

通信作者:任密蜂(1985-),博士,副教授,主要从事随机控制、故障诊断及储能控制方面的研究,(E-mail)renmifeng@126.com

Short-term Fault Prediction Method for Bearing Based on SA-TCN

WANG Siyuan1,2, CHEN Junghui2, GU Kai3, REN Mifeng1, YAN Gaowei1

(1.CollegeofElectricalandPowerEngineering,TaiyuanUniversityofTechnology,Taiyuan030024,China;2.DepartmentofChemicalEngineering,ChungYuanChristianUniversity,Taoyuan320-338,China; 3.StateKeyLaboratoryofNuclearPowerSafetyMonitoringTechnologyandEquipment,ChinaNuclearPowerEngineeringCo.,Ltd.,Shenzhen518172,China)

AbstractPurposes】 Bearing is one of the core components in the manufacturing industry. Its health status determines the safety of the host. Short-term failure prediction can effectively ensure the smooth progress of the industrial production process. 【Methods】 In order to solve the end-to-end problem, a temporal convolutional network (TCN) based short-term fault prediction strategy was proposed. The network could directly output the types of failure that would eventually occur in the bearing and the degradation stage that would be in the next moment through the data monitored at the current moment. In addition, soft threshold with attention mechanism is proposed to solve the problem of background noise in the working environment of bearings or noise interference in the process of data acquisition. During the short-term fault prediction process, the attention mechanism adaptively generates a soft threshold according to the prediction target of the TCN network, and the soft threshold acts on the spatiotemporal features extracted by the TCN to achieve the purpose of reducing noise impact. 【Findings】 The experimental results show that the proposed algorithm has high accuracy, which verifies the effectiveness and high practical engineering application value of the proposed algorithm.

Keywordsshort-term failure prediction; temporal convolutional network; bearing; attention mechanism

在工业生产的各机械设备中,轴承处于不可替代的地位,如汽轮机、风电机和数控机床等[1-2]。随着生产技术的不断发展,现代工业机械设备更加智能化,轴承的服役环境也越来越复杂[3]。为了防止在生产过程中出现设备故障或发生重大事故,对轴承的健康监测刻不容缓[4-5]。传感器采集到的振动信号可以反映轴承的运行状态信息,这些运行状态信息是对轴承进行健康监测的依据[6]。起初,故障诊断技术被用于诊断轴承发生故障后的故障类型。姚德臣等[7]首先对轴承上采集到的振动信号进行小波降噪,再将降噪后的信号使用集合经验模态分解处理为多个本征模态函数特征,最后将该特征输入至模拟退火优化支持向量机中进行故障诊断。由于机器学习的方法无法自动提取特征,因此基于深度学习的故障诊断方法得到了关注。张珂等[8]将注意力机制与卷积神经网络(convolution neural network,CNN)相结合,提出多模态注意力卷积神经网络(multi-modal attention convolutional neural network,MMACNN) 对滚动轴承进行故障诊断。SHEN et al[9]考虑了噪声干扰,首先将堆叠收缩自动编码器用于自适应地提取具有鲁棒性的特征,再对特征进行诊断。但是故障诊断只能作用于故障发生之后,早期故障诊断却可以在轴承设备失效之前监测到设备异常并进行预警,以便维修人员尽早制定维护策略。

由于轴承的早期故障特征不明显,因此姜万录等[10]通过变分模态分解(variational mode decomposition,VMD)和模态C均值聚类的方法提取了消除噪声后的轴承早期故障特征,从而准确地识别到了故障特征频率。但是VMD的分解效果依赖于参数的有效选择,为了解决这一问题,文明等[11]通过自适应软阈值法与动态模式分解相结合,对早期故障频率进行诊断。随后,毛文涛等[12]通过构建改进的最大均值差异正则项和Laplace正则项的损失函数,以增强正常状态和异常状态的差异性,从而实现早期故障诊断。然而,早期故障诊断只能对早期故障特征进行抓取,无法指出轴承将于何时失效。

故障预测技术可以为维修人员提供更多的预测性维护意见。在现有故障预测研究中,大多研究人员直接将故障预测定义为剩余寿命预测,但是这个定义在现代化工业中已无法满足维修人员的需求[13]。原因有两方面:一方面,如果维修人员想要在特定时间段对轴承进行维修,那么就需要提前了解轴承将来可能发生的故障类型,以便提前制定维修策略,而剩余寿命预测只能根据当前时刻的振动信号预测出轴承在此时还剩余多少可用寿命,无法判断未来可能发生的故障类型[14-15];另一方面,如果维修人员要确定轴承是否还能继续在满足生产精度的要求下服役,那么就需要明确轴承在即将到来的时刻将会处于什么样的运行状态,而轴承的剩余寿命与时间完全成反比,与退化趋势不完全成反比。换句话说,剩余寿命无法刻画轴承的退化趋势,因此用剩余寿命这一指标来预测轴承的健康状况是存在一定的局限性的[16-17]。为了解决这一问题,XU et al[18]对反映轴承运行状态的振动信号提取小波包能量特征,再将特征输入至添加注意力机制的长短期记忆神经网络(long short-term memory,LSTM)中对未来的特征进行预测,最后将预测得到的特征输入至分类模型中对未来的故障类型与下一时刻的劣化阶段进行识别。故障类型的预测可以针对文献[18]中小波包能量特征的提取需要人工经验的干预这一问题进行研究。PENG et al[19]采用CNN-LSTM自适应提取振动信号的特征,并通过深度网络对轴承进行短期故障预测,但是这两种做法都未能实现端到端的轴承短期故障预测,这就导致特征提取、特征预测以及对预测得到的特征进行分类,这3个过程各自孤立,从而对最终的短期故障预测结果产生影响。

本文通过将当前时刻采集到的振动信号输入至时序卷积网络(temporal convolutional network,TCN),直接输出下一时刻轴承所处的劣化阶段以及最终会发生的故障类型,从而实现端到端的短期故障预测;此外,考虑到轴承工作环境存在的背景噪声或采集振动信号时噪声干扰,将软阈值注意力机制(soft threshold with attention mechanism,SA)用于自适应生成软阈值,并通过软阈值函数对噪声进行过滤。最后,将所提算法在美国辛辛那提大学的全寿命轴承试验数据上进行实验分析。

1 基于SA-TCN的短期故障预测模型

由于故障诊断技术在轴承发生故障后才能发挥作用,剩余寿命预测技术只能判断某一时刻轴承可用寿命的剩余量,因此这两种轴承健康状况监测技术存在局限性;而轴承短期故障预测技术可以根据当前时刻轴承的运行状态信息预测出下一时刻轴承将要处于的劣化阶段以及轴承最终会发生的故障类型,故本文将建立轴承短期故障预测模型。此外,振动信号不仅可以实时反映出轴承运行状态的变化过程,还可以为基于数据驱动的短期故障预测模型提供充足的数据量,所以采用振动信号作为模型的输入量。

提出的基于SA-TCN的短期故障预测模型共包含3个部分,算法框架及流程如图1所示。第一部分为浅层特征提取模块,这部分对振动信号中包含的轴承运行状态信息进行浅层特征提取并对输入降维。其次为SA-TCN块,TCN部分用于提取浅层特征中的深层抽象特征,具体为TCN通过因果膨胀卷积等操作将当前时刻的特征与当前时刻之前(包括当前时刻)的轴承状态信息建立时间和空间尺度上的因果关系;SA部分根据短期故障预测目的自适应生成过滤TCN处理结果中噪声的阈值,达到降低噪声干扰的目的。最后为输出故障标签模块,此模块将提取到的深层抽象特征解释为未来时刻的故障标签。

图1 SA-TCN短期故障预测算法流程
Fig.1 Flow chart of the SA-TCN short-term fault prediction algorithm

1.1 浅层特征提取

首先将振动信号{Vt}t=1,2,…输入至卷积层中进行卷积操作。由于原始振动信号维度较高且不利于计算,而卷积操作可以在提取振动信号时空特征的同时实现降维,因此采用卷积操作对输入信号进行初步处理,如式(1)所示。

(1)

式中:表示Vt(τ)对应于ith特征图的τth位置的卷积操作输出值;*表示卷积;f(·)表示激活函数;I既表示第一层隐藏层卷积核的数量又表示第一层隐藏层特征图的数量;是第一层隐藏层的ith卷积核。

在得到初步卷积结果后,对得到的特征进行最大池化操作。最大池化操作的作用在于减少特征数量,提取关键特征,如式(2)所示。

(2)

式中:表示第1层隐藏层的第i个特征图的第e个特征值;g表示池化操作的宽度;表示池化层的输出。

对池化结果进行dropout,dropout可以随机丢弃部分神经元,防止模型过拟合,如式(3)所示。

(3)

式中:表示对池化输出进行随机丢弃操作后的结果;(·)表示对神经元进行随机丢弃的dropout函数,表示对第2层隐藏层的第i个通道的神经元以r1为dropout rate进行随机丢弃。

1.2 SA-TCN块

在得到振动信号的浅层特征后,将其送入SA-TCN块提取深层抽象特征,SA-TCN块由TCN子网、SA子网以及残差连接共同构成。

1.2.1TCN子网

近年来,CNN被广泛用于故障诊断与寿命预测领域。CNN具有一维(one-dimensional,1D)、二维(two-dimensional,2D)和三维(three-dimensional,3D)3种形式。2DCNN与3DCNN大多用于图像分类,由于1DCNN可以对一维输入运算处理,因此振动信号大多使用1DCNN进行分析[20]。虽然标准1DCNN具有处理振动信号的能力,但是它的感受野较小,其卷积操作只能映射到局部输入信息,不利于抓取时间序列的特征。因此,提出TCN用于解决这一问题。在本文中,TCN由batch-normalizing、dropout、leaky ReLU激活函数、因果卷积以及膨胀卷积构成。

由于在深度网络的计算过程中可能会发生内部协变量偏移,导致计算前后的数据分布不同,为了防止这种现象的发生,首先对提取到的浅层特征进行batch-normalizing,如式(4)所示:

(4)

式中:μB分别为的均值与标准差;γ为缩放参数;β为平移参数;为batch-normalizing函数;表示batch-normalizing后的结果。

将batch-normalizing后的结果使用leaky ReLU激活函数以弱化与预测目标不相关的特征,同时保留影响预测结果的特征,再对激活后的结果进行dropout,如式(5)-式(6)所示。

La(x)=max(0,x)+kleak×min(0,x) .

(5)

(6)

式中:0<kleak<1,La(x)表示leaky ReLU激活函数;表示对先进行leaky ReLU激活再进行dropout操作,dropout rate为r2.

在对浅层特征进行预处理后,膨胀因果卷积被用于提取振动信号的深层特征。其中,因果卷积仅对当前时刻之前的输入进行卷积,这就将当前卷积操作的输出与输入构成时间维度的因果关系[21];膨胀卷积利用卷积块中呈指数形式增长的卷积步长来扩大卷积操作的感受野,以强化网络输出与输入之间的时序关系,如图2所示。

图2 膨胀因果卷积示意
Fig.2 Diagram of dilated causal convolution

从图2可以看出,TCN进行1次卷积操作的范围可以由式(7)所示。

k=s+(s-1)×(d-1) .

(7)

式中:s为卷积核宽度,d为膨胀率。

为了保证TCN的输入与输出长度相等,需要在每层特征图末尾进行填白操作,填白的元素个数为k-1.

进行膨胀因果卷积操作过程如式(8)所示。

(8)

式中:s表示卷积核的宽度;d1表示膨胀卷积的膨胀率;l0表示进行第1层膨胀因果卷积操作在中的位置;表示第3层隐藏层的第u个卷积核;表示在第3层隐藏层中的第u个特征图的位置的膨胀因果卷积操作结果;U既表示第3层隐藏层卷积核的数量,又表示第3层隐藏层特征图的数量。

为了保持式(8)前后的数据分布不变且弱化与预测目标不相关的特征,再将C3经过batch-normalizing、leaky ReLU与dropout处理,如式(9)所示。

(9)

式中:F(·)表示batch-normalizing、leaky ReLU与dropout操作。

在TCN子网的最后,再对进行一次膨胀因果卷积操作以得到感受野更宽的深层抽象特征,如式(10)所示。

(10)

式中:s表示卷积核的宽度;d2表示膨胀卷积的膨胀率;l1表示进行第2层膨胀因果卷积操作在中的位置;表示第4层隐藏层的第n个卷积核;表示在第4层隐藏层中的第n个特征图位置的膨胀因果卷积结果;N既表示第4层隐藏层卷积核的数量,又表示第4层隐藏层特征图的数量。

1.2.2SA子网

由于轴承工作环境复杂或采集振动信号时可能存在干扰,导致网络提取到的特征也同样包含了噪声的特征,从而短期故障预测的结果会被噪声影响[22]。为了减少这种干扰,将SA用于轴承短期故障预测。本文将使用TCN-SA根据当前的振动信号预测出下一时刻轴承所处的劣化阶段以及最终会发生的故障类型,而非预测轴承的RUL.软阈值注意力机制是一种弱化噪声的方法,具体为将趋近于零的特征设置为0,从而保留关键特征,消除无用噪声,如图3所示。

图3 SA函数可视化
Fig.3 Visualization of the SA functions

此外,SA还可以保留TCN网络提取到的负数特征,从而充分发挥TCN的非线性表达能力。由于噪声不是定值,而是随时间的变化而变化,因此SA的阈值由注意力机制根据预测目标自适应调节。在此处,注意力机制可以表示为如式(11)所示。

(11)

式中:N为第4层隐藏层的特征图个数;r3表示表示对第4层特征图的绝对值进行全局平均池化的结果;ω5b5为第5层隐藏层的权重与偏置量;C5表示对进行全连接层非线性映射的结果;B(·)表示batch-normalization函数;表示对C5进行batch-normalizing操作的结果;f(·)表示ReLU激活函数;表示对进行非线性激活;σ表示sigmoid激活函数;ω6b6分别表示第6层隐藏层的权重与偏置,a表示注意力机制学习到的注意力权重;τ表示注意力机制输出的阈值。

在得到自适应阈值τ后,根据τ建立软阈值函数,并作用于具体计算过程如式(12)所示,表示对膨胀因果卷积结果使用软阈值函数去除噪声干扰后的结果。

(12)

1.2.3残差连接

当深度网络的非线性堆叠层较深时,可能会导致输入信息的遗忘。为了避免这一现象的发生,残差连接被用于增强非线性堆叠层的表达能力[23]。残差连接在图像处理和语音识别中取得了出色的成绩。在本文中,残差网络被用于增强TCN与SA对SA-TCN块输入的非线性映射能力。具体为,在SA-TCN块的最后对添加残差,如下式:

(13)

式中,RST1表示第1个SA-TCN块对输入的处理结果。

此后,将RST1输入至第2、第3个SA-TCN块中,整个过程表示为:

RST3G(RST1) .

(14)

式中:G(·)表示对第一次SA-TCN输出结果进行2次SA-TCN运算,RST3表示连续3个SA-TCN块的处理结果。

1.3 输出故障标签

为了增强网络的非线性表达能力,对3个SA-TCN块处理后的特征RST3使用sigmoid激活函数进行非线性激活,如式(15)所示。

(15)

式中,表示对RST3进行非线性激活的结果,σ(·)表示sigmoid激活函数。

最后使用softmax激活函数对进行解释说明,得到未来t+1时刻的故障标签,如式(16)所示。

(16)

式中,softmax(·)表示softmax激活函数,表示预测网络通过t时刻的输入Vt预测到的t+1时刻的劣化阶段以及最终会发生的故障类型。

2 实验分析

2.1 实验描述

本实验采用美国辛辛那提大学公布的全寿命轴承试验数据[24]进行算法验证。实验平台如图4所示,通过弹簧机构对Rexnord ZA-2115双列轴承施加2.78 kN的径向载荷;转速设置为2 000 r/min;振动信号由PCB 353B33高灵敏度石英ICP加速度计采集,采样频率为20 kHz,采样间隔为10 min,采样时长为1 s.

图4 辛辛那提大学轴承试验平台
Fig.4 University of Cincinnati bearing test rig

数据集共包含了3次轴承退化实验结果,每次实验产生4个轴承的全寿命周期数据。由文献[11]可知,此数据集中的振动信号存在强背景噪声。如表1所示,轴承1-4的可用寿命在采集了2 156组数据后结束,相应生命周期为21 560 min.实验采用第1次退化实验的第4个轴承数据、第2次退化实验的第1个轴承数据以及第3次退化实验的第3个轴承数据,分别记为轴承1-4、轴承2-1与轴承3-3;这3个轴承分别在退化实验的最后发生了滚动元件故障和外圈故障;劣化阶段分别为正常阶段、轻微阶段、严重阶段与失效阶段。因此,在本实验中共包含了7种退化类型,分别是正常、滚动元件轻微故障、滚动元件严重故障、滚动元件失效、外圈轻微故障、外圈严重故障和外圈失效。

表1t时刻轴承振动信号数据
Table 1 Bearing vibration signal data at timet

轴承最终故障类型故障阶段正常轻微严重失效1-4滚动元件1~1 5981 599~2 1262 127~2 1492 150~2 1562-1外圈1~605606~906907~964965~9823-3外圈1~820821~926927~964965~983

注:表中每组数据的采样间隔为10 min.

在数据处理方面,正常阶段的数据量比其他阶段的数据多,这会导致模型对正常阶段数据过拟合,而对轻微阶段、严重阶段与失效阶段的数据欠拟合。又由于正常阶段的数据波动不明显,因此对3个轴承正常阶段的数据进行如下预处理:剔除轴承1-4中1~1 400、轴承2-1中1~331和轴承3-3中1~425的数据,并将删减后的各轴承数据分别重新按振动信号采样先后顺序进行排列。此外,由于本文研究根据t时刻的振动信号预测出t+1时刻轴承所处的劣化阶段与最终会发生的故障类型,故表2给出经过处理后t+1时刻的轴承数据。

表2 预处理后t+1时刻的轴承振动信号数据
Table 2 Bearing vibration signal data at timet+1 after preprocessing

轴承最终故障类型故障阶段正常轻微严重失效1-4滚动元件1~199200~727728~750751~7562-1外圈1~275276~577578~634635~6503-3外圈1~396397~502503~540541~558

注:表中每组数据的采样间隔为10 min.

本文将RMS设置为轴承的健康因子,通过健康因子展示了本次实验使用的3个轴承的退化过程,如图5所示。由图可以看出,由于轴承2-1与轴承3-3均在试验最后发生了外圈故障,因此这2个轴承的退化趋势大致相同,而与轴承1-4的退化趋势有所区别。

图5 实验轴承退化
Fig.5 Experimental bearing degradation process

为了验证所提方法可以在多种退化类型中准确识别测试轴承在各个采样时刻的退化类型,因此训练集由轴承1-4与轴承2-1的整个退化过程产生的振动信号组成,测试集设置为轴承3-3全寿命周期监测到的振动信号。

2.2 超参数设置

本文所提算法的学习率设置为0.001,mini-batch大小为32.所提算法网络由1个卷积层、1个池化层、1个dropout层、3个SA-TCN块、1个dropout层、1个全局平均池化层以及1个全连接层组成,它们的超参数设置如表3所示。

表3 超参数设置
Table 3 Hyperparameter settings

隐藏层参数卷积层卷积核为16,卷积核宽度为12,步长为4池化层宽度为4DropoutDropout rate为0.4SA-TCN块1卷积核为12,卷积核宽度为3,膨胀率为1,leaky rate为0.2,dropout rate为0.3SA-TCN块2卷积核为6,卷积核宽度为3,膨胀率为2,leaky rate为0.2,dropout rate为0.3SA-TCN块3卷积核为4,卷积核宽度为3,膨胀率为4,leaky rate为0.2,dropout rate为0.3DropoutDropout rate为0.3全局平均池化层-全连接层激活函数为softmax,神经元个数为7

2.3 结果分析

从图5可以看出,虽然轴承2-1与轴承3-3属于相同的轴承在同等工况下产生了相同的故障类型,但是它们的退化过程不一致,换句话说,它们退化过程的相似性差,因此本文只进行提前一步的短期故障预测。

模型在训练集上训练好之后,用于测试集进行性能测试。测试结果采用混淆矩阵的方式展示,如图6所示(右侧的值和对应颜色表示比例),处于对角线上的元素表示预测结果与真实标签相同。

图6 短期故障预测结果混淆矩阵
Fig.6 Confusion matrix of the short-term fault prediction results

从图6可以看出,测试集中正常状态的样本全部被正确分类,这就保证了轴承在正常状态运行时,维修人员不会收到错误的反馈信息;外圈轻微故障阶段有7.6%的样本被模型错误地预测为外圈严重故障阶段(3.8%)与滚动体轻微故障阶段(3.8%);外圈严重故障阶段有5.3%的样本被错误地预测为外圈轻微故障阶段;外圈失效阶段有22%的样本被错误地预测为外圈严重故障阶段,但是在工业生产中大多不允许轴承运行到失效阶段,因为处于失效阶段的轴承不仅影响生产精度,而且可能会造成事故的发生。造成外圈故障的劣化阶段被错误预测的原因为,当轴承从上一个劣化阶段退化到下一个劣化阶段时,轴承处于过渡状态还尚未稳定,在这个过渡阶段采集到的轴承振动信号包含着两个劣化阶段的特征,因此预测结果出现了偏差。此外,预测模型可以通过当前的振动信号准确地预测出轴承最终会发生的故障类型;虽然预测模型无法将劣化阶段完全预测正确,但是模型仍取得了不错的预测效果。

2.4 算法比较

为了验证提出的SA-TCN在短期故障预测方面的有效性,与其他3种算法(CNN,TCN,SA-CNN)进行了对比。性能评价指标如式(17)所示。

(17)

式中:PI表示测试集中样本被正确分类的数目,PF表示测试集中样本没有被正确分类的数目,A表示准确率。对比结果如表4所示。

表4 不同故障预测方法对比结果
Table 4 Comparison of different fault prediction methods

方法准确率CNN0.879 9TCN0.867 2SA-CNN0.951 6SA-TCN*0.944 4SA-TCN0.974 9

由表4可以看出,本文所提出的SA-TCN算法在5种算法中取得了最高的预测精度,为0.974 9.精度最低的算法为TCN算法,为0.867 2,TCN算法的预测精度低于CNN(0.879 9)的预测精度。这不能表明TCN的时间序列处理能力弱于CNN;相反,这恰恰是由于TCN的时间序列处理能力强于CNN,才会导致的结果。因为采集到的信号中包含噪声,而在预测过程中TCN受到了噪声的影响,才使其无法正确捕捉到轴承运行过程中的关键特征,从而预测精度低于CNN.此外,SA-CNN与SA-TCN的预测精度分别明显高于CNN与TCN,这表明SA可以有效过滤噪声。当SA分别作用于CNN与TCN时,可以看出,在过滤掉噪声之后TCN(膨胀因果卷积)的预测效果优于CNN(常规卷积)。SA-TCN*为本文所提算法去除浅层特征提取模块后的算法,其精度(0.944 4)低于本文所提算法,这是由于浅层特征提取模块中的卷积操作与池化操作可以在提取关键特征的同时实现对输入信号的初步降噪及滤波处理。总体来说,本文提出的SA-TCN算法不仅可以端到端的实现短期故障预测,还更适合处理噪声影响下的轴承故障信号,具有较强的工程应用前景。

3 结论

现有轴承短期故障预测方法,大致可分为3个步骤,即特征提取、对特征进行预测以及将预测得到的特征进行分类。这种短期故障预测方法不仅操作过程繁琐,而且会产生3个孤立的目标函数,从而产生误差。为了避免这种情况的发生,本文通过将当前时刻对轴承采集到的振动信号输入至TCN,TCN直接端到端地输出下一时刻轴承所处的劣化阶段以及最终会发生的故障类型。再者,考虑到轴承所处环境存在背景噪声或采集运行状态信息时存在噪声干扰,通过SA与TCN结合以过滤噪声。其中,注意力机制根据预测目标自适应生成软阈值,再基于生成的软阈值设置软阈值函数作用于特征提取过程,以实现降低噪声影响的目的。最终,实验结果表明所提算法可以在强背景噪声下实现端到端的轴承短期故障预测。

参考文献:

[1] 郑锦妮,边杰.综合CEEMDAN-SVD与倒频谱的滚动轴承故障诊断方法[J].太原理工大学学报,2021,52(3):495-501.

ZHENG J N,BIAN J.Rolling bearings fault diagnosis method intergrating CEEMDAN-SVD and cepstrum[J].Journal of Taiyuan University of Technology,2021,52(3):495-501.

[2] 刘建昌,权贺,于霞,等.基于参数优化VMD和样本熵的滚动轴承故障诊断[J].自动化学报,2022,48(3):808-819.

LIU J C,QUAN H,YU X,et al.Rolling bearing fault diagnosis based on parameter optimization VMD and sample entropy[J].Acta Automatica Sinica,2022,48(3):808-819.

[3] 张绍辉.集成参数自适应调整及隐含层降噪的深层RBM算法[J].自动化学报,2017,43(5):855-865.

ZHANG S H.Deep RBM algorithm with adaptive adjustment parameters and de-noising in hidden layer[J].Acta Automatica Sinica,2017,43(5):855-865.

[4] 刘强,方彤,董一凝,等.基于动态建模与重构的列车轴承故障检测和定位[J].自动化学报,2019,45(12):2233-2241.

LIU Q,FANG T,DONG Y N,et al.Dynamic modeling and reconstruction based fault detection and location of train bearings[J].Acta Automatica Sinica,2019,45(12):2233-2241.

[5] 朱伏平,秦琴,杨方燕,等.基于信息融合技术的滚动轴承故障预测方法[J].机械设计,2023,40(1):56-64.

ZHU F P,QIN Q,YANG F Y,et al.Rolling bearing fault prediction method based on information fusion technology[J].Journal of Machine Design,2023,40(1):56-64.

[6] 康守强,周月,王玉静,等.基于改进SAE和双向LSTM的滚动轴承RUL预测方法[J].自动化学报,2022,48(8):1-10.

KANG S Q,ZHOU Y,WANG Y J,et al.RUL prediction method of a rolling bearing based on improved SAE and Bi-LSTM[J].Acta Automatica Sinica,2022,48(8):1-10.

[7] 姚德臣,杨建伟,程晓卿,等.基于多尺度本征模态排列熵和SA-SVM的轴承故障诊断研究[J].机械工程学报,2018,54(9):168-176.

YAO D C,YANG J W,CHENG X Q,et al.Railway rolling bearing fault diagnosis based on multi-scale IMF premutation entropy and SA-SVM classifier[J].Journal of Mechanical Engineering,2018,54(9):168-176.

[8] 张珂,王竞禹,石怀涛,等.基于CNN的变工况滚动轴承故障诊断研究[J].控制工程,2022,29(2):254-262.

ZHANG K,WANG J Y,SHI H T,et al.Research on rolling bearing fault diagnosis under variable working conditions based on CNN[J].Control Engineering of China,2022,29(2):254-262.

[9] SHEN C,QI Y,WANG J,et al.An automatic and robust features learning method for rotating machinery fault diagnosis based on contractive autoencoder[J].Engineering Applications of Artificial Intelligence,2018,76:170-184.

[10] 姜万录,王振威,朱勇,等.基于VMD消噪处理的滚动轴承早期故障识别[J].液压与气动,2017(5):13-20.

JIANG W L,WANG Z W,ZHU Y,et al.VMD denoising processing-based early fault recognition method of rolling bearings[J].Chinese Hydraulics &Pneumatics,2017(5):13-20.

[11] 文明,党章,余震,等.动态模式分解及其在轴承早期故障诊断中的应用[J].振动与冲击,2022,41(12):313-320.

WEN M,DANG Z,YU Z,et al.Dynamic mode decomposition and its application in early bearing fault diagnosis[J].Journal of Vibration and Shock,2022,41(12):313-320.

[12] 毛文涛,田思雨,窦智,等.一种基于深度迁移学习的滚动轴承早期故障在线检测方法[J].自动化学报,2022,48(1):302-314.

MAO W T,TIAN S Y,DOU Zet al.A new deep transfer learning-based online detection method of rolling bearing early fault[J].Acta Automatica Sinica,2022,48(1):302-314.

[13] 彭宇,刘大同,彭喜元.故障预测与健康管理技术综述[J].电子测量与仪器学报,2010,24(1):1-9.

PENG Y,LIU D T,PENG X Y.A review:prognostics and health management[J].Journal of Electronic Measurement and Instrument,2010,24(1):1-9.

[14] QIN Y,CHEN D,XIANG S,et al.Gated dual attention unit neural networks for remaining useful life prediction of rolling bearings[J].IEEE Transactions on Industrial Informatics,2021,17(9):6438-6447.

[15] WANG Y,PENG Y,ZI Y,et al.A two-stage data-driven-based prognostic approach for bearing degradation problem[J].IEEE Transactions on Industrial Informatics,2016,12(3):924-932.

[16] NING D A,HL B,ZY B,et al.A novel method for journal bearing degradation evaluation and remaining useful life prediction under different working conditions[J].Measurement,2021,177:109273.

[17] CAO Y,JIA M,DING P,et al.Transfer learning for remaining useful life prediction of multi-conditions bearings based on bidirectional-GRU network[J].Measurement,2021,178(5):109287.

[18] XU H,MA R,YAN L,et al.Two-stage prediction of machinery fault trend based on deep learning for time series analysis[J].Digital Signal Processing,2021,117:103150.

[19] PENG H,LI H,ZHANG Y,et al.Multi-sensor vibration signal based three-stage fault prediction for rotating mechanical equipment[J].Entropy,2022,24(2):164.

[20] 冯浩楠,付胜,胥永刚.基于BN-1DCNN的旋转机械故障诊断研究[J].振动与冲击,2021,40(19):302-308.

FENG H N,FU S,XU Y G.Fault diagnosis of rotating machinery based on BN-1DCNN model[J].Journal of Vibration and Shock,2021,40(19):302-308.

[21] LEA C,FLYNN M D,VIDAL R,et al.Temporal convolutional networks for action segmentation and detection[C]∥Proceedings of the IEEE conference on computer vision and pattern recognition.Las Vegas:IEEE,2017:156-165.

[22] WANG Y,DENG L,ZHENG L,et al.Temporal convolutional network with soft thresholding and attention mechanism for machinery prognostics[J].Journal of Manufacturing Systems,2021,60:512-526.

[23] HE K,ZHANG X,REN S,et al.Deep residual learning for image recognition[C]∥Proceedings of the IEEE conference on computer vision and pattern recognition.Las Vegas:IEEE,2016:770-778.

[24] LEE J,QIU H,YU G,et al.Rexnord technical services:bearing data set[DB/OL].IMS.University of Cincinnati,NASA ames prognostics data repository[2007-03-01].http:∥ti.arc.nasa.gov/project/prognostics-data-repository.

(编辑:朱 倩)

Baidu
map