高级检索

基于VAE-WGAN的矿井提升机主轴承小样本故障诊断方法

江帆, 宋泓炎, 沈熙, 朱真才, 程舒曼

江 帆,宋泓炎,沈 熙,等. 基于VAE-WGAN的矿井提升机主轴承小样本故障诊断方法[J]. 煤炭科学技术,2025,53(S1):1−15. DOI: 10.12438/cst.2023-1503
引用本文: 江 帆,宋泓炎,沈 熙,等. 基于VAE-WGAN的矿井提升机主轴承小样本故障诊断方法[J]. 煤炭科学技术,2025,53(S1):1−15. DOI: 10.12438/cst.2023-1503
JIANG Fan,SONG Hongyan,SHEN Xi,et al. Fault diagnosis method of mine hoist main bearing with small sample based on VAE-WGAN[J]. Coal Science and Technology,2025,53(S1):1−15. DOI: 10.12438/cst.2023-1503
Citation: JIANG Fan,SONG Hongyan,SHEN Xi,et al. Fault diagnosis method of mine hoist main bearing with small sample based on VAE-WGAN[J]. Coal Science and Technology,2025,53(S1):1−15. DOI: 10.12438/cst.2023-1503

基于VAE-WGAN的矿井提升机主轴承小样本故障诊断方法

基金项目: 国家自然科学基金资助项目(52374163,51605478);江苏省科技成果转化专项资金资助项目(BA2022075)
详细信息
    作者简介:

    江帆: (1987—),男,湖南祁东人,副教授,博士。E-mail:jiangfan25709@163.com

  • 中图分类号: TD534

Fault diagnosis method of mine hoist main bearing with small sample based on VAE-WGAN

  • 摘要:

    作为提升机的关键组件,主轴承在长时间高速重载服役过程中,其性能会发生退化并导致故障产生,故开展提升机主轴承故障诊断对保障矿井提升机安全高效运行具有重要意义。然而,矿井提升机运行状态监测的数据中正常服役与故障状态的比重严重失调,呈现出正常样本多、故障样本少、标签样本不足等特点,导致矿井提升机主轴承故障模型训练效果不理想、诊断准确度低。针对小样本下矿井提升机主轴承故障诊断准确率低的问题,通过融合变分自编码器和Wasserstein生成对抗网络,构建基于VAE-WGAN的矿井提升机主轴承样本增广模型,进而提出基于CBAM-MoblieNetV2的故障诊断方法,实现小样本数据下的矿井提升机主轴承故障诊断。在算法层面上,引入Wasserstein距离度量,解决生成对抗网络训练梯度消失问题。在数据层面上,使用凯斯西储大学数据集对VAE-WGAN进行测试,并通过量化指标评价VAE-WGAN生成能力的方式优选超参数,再用矿井提升机模拟实验台轴承数据集训练VAE-WGAN,实现小样本数据集增广扩容。为了提升故障诊断模型的特征提取能力和故障诊断准确率,在轻量化卷积神经网络MobileNetV2的基础上,将卷积块注意力机制CBAM融合到MobileNetV2深层特征映射,搭建注意力机制卷积分类网络CBAM-MobileNetV2,通过融合跨通道信息和空间信息实现更多地关注故障特征。最后与WGAN_GP、DCGAN,VAE以及WGAN等传统生成模型进行了对比分析,VAE-WGAN+CBAM-MobileNetV2在4种小样本比例数据集上的准确率均高于其他4种方法,证明了所提样本增广和故障诊断方法在不同小样本比例故障数据集上的故障诊断诊断准确率更高,能够满足小样本下的故障诊断要求。

    Abstract:

    As a key component of the hoist, the main bearing may deteriorate in performance and cause faults during long-term high-speed and heavy-duty service. Therefore, conducting fault diagnosis of the main bearing of the hoist is of great significance for ensuring the safe and efficient operation of the mine hoist. However, the proportion of normal service and fault status in the monitoring data of the operation status of mine hoists is severely imbalanced, showing characteristics such as a large number of normal samples, a small number of fault samples, and insufficient label samples, resulting in unsatisfactory training results and low diagnostic accuracy of the main bearing fault model of mine hoists. In response to the problem of low accuracy in fault diagnosis of mine hoist main bearings under small samples, a VAE-WGAN based mine hoist main bearing sample augmentation model was constructed by fusing variational autoencoder and Wasserstein to generate adversarial networks. Furthermore, a fault diagnosis method based on CBAM-MobileNetV2 is proposed to achieve fault diagnosis of mine hoist main bearings under small sample data. At the algorithmic level, the Wasserstein distance metric is introduced to solve the problem of vanishing training gradients in generative adversarial networks. At the data level, VAE-WGAN was tested using the Case Western Reserve University dataset, and hyperparameters were optimized by evaluating the generation ability of VAE-WGAN through quantitative indicators. VAE-WGAN was trained using the bearing dataset of the mine hoist simulation test bench to achieve the expansion and expansion of the small sample dataset. In order to improve the feature extraction ability and fault diagnosis accuracy of fault diagnosis models, based on the lightweight convolutional neural network MobileNetV2, the convolutional block attention mechanism CBAM is integrated into the deep feature mapping of MobileNetV2, and an attention mechanism convolutional classification network CBAM-MobileNetV2 is constructed. By integrating cross channel and spatial information, more attention is paid to fault features. Finally, a comparative analysis was conducted with traditional generation models such as WGAN-GP, DCGAN, VAE, and WGAN. The fault diagnosis accuracy of VAE-WGAN+CBAM-MobileNetV2 on four small sample ratio datasets was higher than the other four methods, proving that the proposed sample augmentation and fault diagnosis methods have higher diagnostic accuracy on different small sample ratio fault datasets and can meet the fault diagnosis requirements under small samples.

  • 矿井提升机是集机、电、液于一体的大型复杂设备,承担着运输煤炭、矸石、人员和设备的重要任务,是矿井生产的“咽喉”[1]。主轴装置是矿井提升机的核心部件,主要由主轴、主轴承、轴承座、轴承盖和卷筒等组成。主轴装置在长期高负载运转后,其主轴承会产生性能退化而出现故障,例如:内圈故障、外圈故障和滚动体故障等。当主轴承发生故障时,主轴装置的承载能力和振动特性会发生变化,并随着提升钢丝绳传递放大,从而导致提升机在提升重物过程中动载荷剧烈变化,影响矿井人员和矿料提升的平稳性[2-3]。此外,主轴承故障会导致提升系统综合性能下降,给矿井生产带来巨大的安全隐患[4]。因此,主轴承故障准确诊断对提高矿井提升机安全高效运行水平具有重要意义。

    近年来,生成对抗网络(Generative Adversarial Networks,GAN)被广泛应用于机械故障诊断领域,其是一种全新的生成模型,能够通过生成数据来实现对数据集的扩容和平衡,是目前深度学习领域最热门的研究方向之一[5-6]。此外,GAN还是一种无监督学习模型,无需对数据集进行人为标注即可自动学习到数据中的关键特征,并生成高质量的数据样本[7]。陈其[8]将GAN与SDAE网络进行结合,解决了传动系统主轴承的故障诊断问题,提高了故障诊断的准确率。PLAKIAS等[9]将GAN应用于故障图像样本扩容,提出一种基于GAN网络无监督训练的多维问题单类故障检测方案。针对单一GAN网络在样本扩容精度低的问题,DING等[10]提出了一种基于GANs的小样本故障诊断方法,与其他诊断方法相比,该方法在训练样本较少的情况下,能够自适应地稳定判别不同工况下的故障模式。相比传统的网络训练方法,GAN可以不需要复杂的马尔科夫链,而是使用反向传播进行优化,其两部分模型中都可以使用任意可微的函数,使GAN的可扩展性更高。虽然GAN在应用时存在很多优势,但是目前仍然存在一些问题:1)GAN存在不收敛问题;2)GAN存在难以训练和模式崩溃问题;3)GAN中的生成器和判别器存在对抗性问题。

    针对上述问题,部分研究人员对GAN的损失函数进行了改进研究。如果两个分布之间存在交集,JS散度在测量两个分布之间的距离时所得到的值为一定值,从而出现梯度消失问题。针对这一问题,ARKOVSKY等[11]对损失函数进行了优化,引入了Wasserstein距离,提出了Wasserstein生成对抗网络,即WGAN,解决了JS散度导数不连续的问题,一定程度上解决了梯度消失和模式崩溃的问题。为了提高生成器生成样本的可解释性,QI等[12]提出了损失敏感的生成对抗网络,即LS-GAN,通过Lipschitz条件对损失函数进行正则化约束。然而在工程实际中,提升机主轴承正常样本多,故障样本少,不易采集,上述的研究仍然没有解决在小样本下的提升机主轴承故障诊断准确率低的问题。

    因此,针对小样本模式故障诊断问题,笔者提出了一种样本增广模型VAE-WGAN(Variational Auto Encoder-Wasserstein Generative Adversarial Networks),并将卷积块注意力机制CBAM融合到MobileNetV2轻量化卷积神经网络模型的深层特征映射,搭建了注意力机制卷积分类网络CBAM-MobileNetV2,从而实现矿井提升机主轴承小样本故障诊断。首先,将矿井提升机时域振动信号转换为二维时频图,并输入到VAE-WGAN中进行对抗训练和学习样本数据特征。然后,当模型达到纳什均衡后生成主轴承故障样本数据,并使用生成数据样本对主轴承故障数据集进行增广扩容。最后,将主轴承增广数据集输入到CBAM-MobileNetV2进行轴承故障诊断。

    随着变分自编码器和生成对抗网络的研究逐渐成熟,LARSEN等[14]将二者结合起来,提出了VAE-GAN。VAE的编码器主要功能是将输入的数据映射到潜层空间,并进行特征提取。原始的VAE-GAN模型仅仅是将VAE和GAN进行了简单的连接。VAE的解码器与GAN的生成器进行参数共享,串联起来构成假样本$\tilde x$的生成器,编码器输出的隐变量z作为生成器的输入。VAE-GAN的判别器是一个二分类器,用于判断输入进来的数据真实与否。VAE-GAN是一种具有特征编码、样本生成、样本比较等多种功能的生成模型。

    笔者基于目前已有的VAE和WGAN2种模型,提出了VAE-WGAN模型。该模型在损失函数和模型训练两方面作了改进,将损失函数分为编码损失、生成损失、判别损失3个部分,并独立更新每个部分的网络。

    VAE-WGAN模型结构如图1所示,它是由编码器Encoder、生成器Generator(解码器)和判别器Discriminator 3个网络构成。VAE的解码器同时也是WGAN的生成器。编码器和生成器组成VAE-WGAN的VAE模块,生成器和判别器组成VAE-WGAN的WGAN模块。以下将编码器、生成器和判别器分别称为EGD。在网络反向传播阶段,需要对VAE-WGAN的梯度进行更新,并最小化目标损失函数。

    图  1  VAE-WGAN模型详细结构
    Figure  1.  Detailed structure of VAE-WGAN model

    该模块由编码器E和生成器G组成。VAE的优化目标为最小化编码损失,如式(1)所示。其中,x为输入数据;G(E(x))为VAE输出。优化目标为最小化输入和输出之间的欧氏距离(L2范数距离)。

    $$ \mathop {{\mathrm{min}}}\limits_{\left( {E,G} \right)} {V_{L2}}\left( {E,G} \right) = {{E}_{x: {P_X}}}\left[ {{{\left\| {x - G\left( {E\left( x \right)} \right)} \right\|}_2}} \right] $$ (1)

    式中:${E}_{x: {P_X}} $为潜在变量Px时数据 x 的条件概率分布。

    该模块是由生成器G和判别器D组成。WGAN的生成器损失采用Wasserstein距离度量代替JS散度来计算,如式(2)所示。通过最小化生成损失,对生成器参数进行更新,来完成生成器D的训练目标。

    $$\begin{split} &\qquad \mathop {\min }\limits_G \mathop {\max }\limits_{\left\| D \right\| \leqslant 1} V\left( {D,E} \right) =\\& {{E}_{z: {P_Z}}}\left[ {G\left( z \right)} \right] - {{E}_{x : {P_X}}}\left[ {D\left( {G\left( x \right)} \right)} \right] \end{split}$$ (2)

    式中:$E_{z:P_z} $为潜在变量Pz时数据 z 的条件概率分布。

    WGAN的判别器损失同样使用Wasserstein距离度量来进行计算。为了使VAE的重构输出和输入数据间的分布更为接近和相似,使用判别器D来计算重构输出和输入数据间的分布距离。WGAN判别器损失如下:

    $$\begin{split} &\qquad \mathop {{\min} }\limits_G \mathop {\max }\limits_{\left\| D \right\| \leqslant 1} V\left( {D,G} \right) = \\& {{E}_{x: {P_X}}}\left[ {D\left( x \right)} \right] - {{E}_{x :{P_X}}}\left[ {D\left( {G\left( {E\left( x \right)} \right)} \right)} \right] \end{split}$$ (3)

    VAE-WGAN的训练需要优化VAE部分的编码损失和WGAN部分的生成损失和判别损失。因此训练VAE-WGAN要优化3个目标函数。将这3个目标函数赋予权重,并进行求和,VAE-WGAN的整体目标函数可表示为

    $$ \mathop {\min}\limits_{\left\{ {E,G} \right\}} \mathop {\max}\limits_{\left\{ {\left\| D \right\| \leqslant 1} \right\}} \alpha {V_{L2}}\left( {E,G} \right) + \beta {V_{L2}}\left( {D,E} \right) + \gamma \left( {D,G} \right) $$ (4)

    其中,$ \alpha $、$ \beta $和$ \gamma $为3部分损失的权值。3个损失函数权值和为$ \alpha $+$ \beta $+$ \gamma $=1。

    基于目前已有的CBAM和MobileNetV2 2种模型,提出了CBAM-MobileNetV2模型。将 CBAM 注意力机制融入轻量化卷积网络 MobileNetV2,使网络模型更多地关注故障特征,提高特征提取能力。将卷积块注意力模块CBAM插入MobileNetV2的深层特征映射,以便获得更深层次的通道注意力,提高故障分类的精度。

    MobileNetV2在MobileNetV1的基础上,参照了VGG系列深层卷积结构而设计的,相较于MobileNetV1,准确率更高,模型更小[15-16]。此外,除了继续沿用MobileNetV1的深度可分离卷积结构,MobileNetV2同时也参考了ResNet[17]系列残差结构。主要改进有2点:

    首先,ResNet的残差块是先用1×1的卷积降维,然后进行升维。而在MobileNetV2中则完全相反,MobileNetV2提出了倒残差块(Inverted residual block)结构,先升维,再进行降维。从结构上来说,ResNet残差块是两头大,中间小的结构。MobileNetV2倒残差块是中间大,两头小的结构,残差块和倒残差块结构如图2所示。

    图  2  ResNet残差块和MobileNetV2倒残差块
    Figure  2.  ResNet residual block and MobileNetV2 inverted residual block

    其次,针对ReLU激活函数在低维空间中信息丢失的问题,MobileNetV2采用线性瓶颈层,以达到增强模型表达能力的目的。

    除继续使用深度可分离卷积层外(Depthwise Convolution),MobileNetV2还使用了膨胀层(Expansion layer)和投影层(Projection layer)。其中,投影层不再使用非线性激活函数ReLU,而改为了线性激活函数。MobileNetV2整体网络结构配置如表1所示,其包括32个卷积核的卷积层,后接17个倒残差瓶颈模块,卷积核尺寸均为3×3。使用ReLU6作为非线性激活函数,为了避免训练过程中出现过拟合,采用了Dropout和Batch Normalization。其中,t为卷积升维率;c为输出深度;n为相同层的个数;s为第1层深度可分离卷积的步长,其他层的步长为1。

    表  1  MobileNetV2 整体网络结构配置
    Table  1.  Overall network structure configuration of MobileNetV2
    Input Operator t c n s
    2242×3 Conv2d - 32 1 2
    1122×32 bottleneck 1 16 1 1
    1122×16 bottleneck 6 24 2 2
    562×24 bottleneck 6 32 3 2
    282×32 bottleneck 6 64 4 2
    142×64 bottleneck 6 96 3 1
    142×96 bottleneck 6 160 3 2
    72×160 bottleneck 6 320 1 1
    72×320 Conv2d 1×1 - 1280 1 1
    72×1280 Avgpool 7×7 - - 1 1
    1×1×1280 Conv2d 1×1 - k - -
    下载: 导出CSV 
    | 显示表格

    CBAM(Convolutional Block Attention Module)是一个轻量级通用模块,可以在不增加额外算力的前提下,嵌入到卷积神经网络结构中[18]。相关论文实验表明,嵌入CBAM的网络模型在分类问题上的准确率均有一定程度的提升[19-20]。CBAM的原理是将进行最大池化和平均池化后得到的两个特征通道的特征图进行加权,并依据通道和空间两个维度的高维特征信息来生成网络权重,从而对初始特征图进行有效的重标定[21]

    假定一个特征为图$X \in {R^{H \times W \times C}}$,其中H为图像的高度;W为图像的宽度;C为图像的通道数。CBAM使用特征通道和特征空间2个维度构造通道注意力${M_C} \in {R^{1 \times 1 \times C}}$和空间注意力${M_S} \in {R^{H \times W \times 1}}$。式(5)和式(6)是通道注意力和空间注意力的表达式。图3为CBAM结构的原理图。

    图  3  CBAM结构原理
    Figure  3.  Schematic diagram of CBAM structure
    $$ X' = {M_C}\left( X \right) \otimes X $$ (5)
    $$ X'' = {M_S}\left( {X'} \right) \otimes X' $$ (6)

    通道注意力和空间注意力共同构成了卷积块注意力模块,卷积块注意力模块是通过计算通道之间的关联度来实现通道的注意力。特征图在构造通道注意力后,需要进一步输入到空间注意力中,以提取到特征图的空间位置信息,实现特征图在空间上的联结。空间注意力特征图的计算步骤如下:第1步将通道注意力的输出输入到最大池化层、平均池化层中进行特征提取;第2步将第一步输出特征图的通道信息整合成2组特征描述符;第3步将特征图进行空间联结,并输入到卷积层中,从而得到空间注意力特征图${M_s}\left( X \right) \in {R^{H \times W}}$,实现空间位置的编码。

    由于笔者采用的CWRU实验台和矿井提升机故障模拟实验台的轴承振动数据都是一维时域信号,故不能直接输入到VAE-WGAN和二维卷积网络中进行训练,因此笔者采用了更为简单的数据变换方式,如图4所示。由于轴承振动数据是周期性信号,于是可以对振动信号进行预处理,利用振动信号振幅归一化与像素之间的关系,将一维时域信号插入一定数量的采样点变换成二维灰度图。

    图  4  振动信号的灰度图变换
    Figure  4.  Grayscale image transformation of vibration signals

    此外,由于测量得到的实验台数据长度有限,为了增加数据样本,采用随机采样的方法对实验台数据进行截取。灰度图的色值范围通常在[0,255]之间,为了便于神经网络进行训练,需要对灰度图进行Min-Max归一化处理,转换到[0,1]之间。归一化计算式如下:

    $$ x' = \frac{{x - \min\left( x \right)}}{{\max\left( x \right) - \min\left( x \right)}} $$ (7)

    其中,$x'$为归一化后的数据;x为原始数据;min(·)为原始数据最小值;max(·)为原始数据最高值。

    针对小样本下的轴承故障诊断问题,首先利用VAE-WGAN模型对主轴承振动信号样本进行增广扩容,并使用FID值和LPIPS值两个指标对生成样本的质量进行评估,然后构建CBAM-MobileNetV2模型完成故障分类。VAE-WGAN采用交替对抗训练的策略,即生成器和判别器分别交替对抗训练,直到模型达到纳什均衡。此外, VAE-WGAN样本增广模型引入了权重裁枝剪方法,即将判别器的权重进行限制,以避免训练中出现梯度消失的问题。

    除了采用准确率作为CBAM-MobileNetV2的分类性能评价指标,还使用FID分数和LPIPS分数作为评价VAE-WGAN生成数据质量好坏的重要指标。

    FID分数可用于评估生成样本的质量,其通过计算真实样本与生成样本特征向量之间的弗雷歇感知距离(Fréchet Inception Distance)得出。相较于Inception Score,FID在评估过程中引入相似图像对比[22]。FID分数越低表示生成样本的分布越接近真实样本的分布,即代表生成网络的拟合能力越强。

    FID分数的核心思想是计算2个多维特征分布之间的均值和协方差矩阵的关系。这可以用作判断不同数据分布之间差异的指标。均值的维度与特征的维度相同,而协方差矩阵的维度是特征维度的平方。FID分数的计算公式如式(8)所示。

    $$ \begin{gathered} FID = {\left\| {{\mu _{{\mathrm{real}}}} - {\mu _{\mathrm{g}}}} \right\|^2} + {T_r}\left( {{{\boldsymbol{C}}_{{\mathrm{real}}}} + {{\boldsymbol{C}}_{\mathrm{g}}} - 2\sqrt {{{\boldsymbol{C}}_{{\mathrm{real}}}}{{\boldsymbol{C}}_{\mathrm{g}}}} } \right) \\ \end{gathered} $$ (8)

    式中:$\mu_{\mathrm{real}} $为真实图像在Inception网络的特征均值;μg为生成图像在Inception网络的特征均值;Creal为真实图像特征的协方差矩阵;Cg为生成图像特征的协方差矩阵;Tr为矩阵的迹(对角线元素之和)。

    基于学习的图像块感知相似度[23](LPIPS)可用于度量2张图像之间的相似程度,它是通过图像的深层特征来度量图像间的感知相似度,更符合人类的感知情况。LPIPS的结果越低表示图像在感知度量上越相似。图5是LPIPS分数的数学计算过程,其数学计算式为

    图  5  LPIPS计算过程示意
    Figure  5.  Schematic diagram of LPIPS calculation process
    $$ LPIPS = \sum\limits_t {\frac{1}{{{H_l}{W_l}}}} \sum\limits_{h,w} {\left\| {{w^l} \odot \left( {\hat y_{hw}^l - \hat y_{0hw}^l} \right)} \right\|} _2^2 $$ (9)

    式中:Hl为第l层图像的高度;Wl为第l层图像的宽度;wl为每一层特征差异的加权系数;$\hat y_{hw}^l $与$\hat y_{0hw}^l $为2张待比较的图像。

    笔者采用的分类模型CBAM-MobileNetV2对VAE-WGAN增广扩容后的提升机主轴承灰度故障数据进行分类。由于CBAM是一种非降维注意力模块,它不会改变特征维度,且模块不限制输入特征的尺寸大小,所以它可以被插入在网络的任何位置,并且不影响网络的正常运行,也不会改变网络参数和结构。常用的插入位置为深层特征映射前或深层特征映射后。CBAM模块对输入的特征图,先分别平均池化和最大池化,再通过同一个多层感知机(multilayer perceptron, MLP)和Sigmoid激活函数,学习通道权重,再将其分别平均池化和最大池化后通过一个3×3的空洞卷积和Sigmoid激活函数,学习空间各点权重,最终生成权重优化的特征图

    在CNN中,底层卷积层通常是提取了数据中非常简单且通用的特征,这些特征适用于所有图像。而随着网络层次加深,深层网络能提取到代表所有训练数据的特征。因此,笔者选择将卷积块注意力模块CBAM插入在MobileNetV2的深层特征映射之后,以便获得更深层次的通道注意力。从特征通道和空间两个方面来聚合特征,从而可以提高模型的故障诊断准确率。改进网络模型CBAM-MobileNetV2如图6所示。

    图  6  CBAM-MobileNetV2结构
    Figure  6.  Structure diagram of CBAM-MobileNetV2

    基于VAE-WGAN和CBAM-MobileNetV2的主轴承故障诊断流程如图7所示,具体步骤如下:

    图  7  VAE-GAN +CBAM-MobileNetV2诊断算法训练流程
    Figure  7.  Diagnostic algorithm training process of VAE-GAN+CBAM-MobileNetV2

    1) 为了使用VAE-WGAN处理实验采集的轴承故障数据,需要将采集到的一维时域振动信号转换为二维数据。笔者将一维时域信号插入一定数量的采样点变换成二维灰度图,按照每4096个数据点将一维时域信号转换成64×64大小的二维灰度图。实验中将预处理好的数据集划分为训练集和测试集。

    2) 对每个训练集中的灰度图故障类样本进行增广扩容。将样本输入到VAE-WGAN模型进行训练,当达到最大训练次数时,保存模型参数。然后,利用生成网络生成新样本,并将生成的故障样本与原始训练集混合,以实现对故障样本的增广扩容。

    3) 为了确定VAE-WGAN最优的超参数并得到生成效果最优的故障样本增广模型,需要计算各类故障增广数据集的FID值和LPIPS值,重新训练后保存模型参数,然后用生成网络生成故障样本,得到生成效果最优的增广数据集。

    4) 使用生成效果最优的增广数据集训练CBAM-MobileNetV2模型,然后使用训练完成的模型对测试集数据进行诊断,通过轻量化卷积神经网络强大的特征提取能力实现对各类样本的准确识别和分类。

    实际工况下提升机系统中主轴承监测数据具有非线性、非平稳性等特点,且可用典型故障数据少,人为的故障模拟故障数据难度大,故传统方法难以达到较高的诊断精度。为了评估提出的VAE-GAN+MobileNetV2故障诊断方法对矿井提升机主轴承故障诊断的性能,分别使用矿井提升机故障模拟实验台采集的轴承数据和凯斯西储大学(CWRU)轴承数据集进行方法可行性验证,并与几种常见方法进行对比分析。

    使用CWRU轴承数据集和矿井提升机故障模拟实验台轴承数据集作为实验数据,其实验台分别如图8a和图8b所示。CWRU轴承实验台由电动机、扭矩传感器、功率测试计以及电子控制器构成,可采集风扇端、驱动端以及基座的轴承振动加速度信号。

    图  8  CWRU轴承采样实验平台和矿井提升机故障模拟实验台
    Figure  8.  CWRU bearing sampling experimental platform and mine hoist fault simulation experimental bench

    矿井提升机故障模拟实验台包含驱动部分和提升部分,驱动部分包括电机、联轴器、齿轮箱、主轴以及轴承座(含主轴承)部件。提升部分则由卷筒、提升钢丝绳、柔性罐道以及箕斗等组成。对于矿井提升机故障模拟实验台,通过人为线切割的加工方式来模拟主轴承滚动体故障BF、内圈故障IF、外圈故障OF以及正常样本Normal,如图9所示。主轴承的切割口加工宽度为2 mm,加工深度为1.5 mm。由于实际加工中会存在误差,故障轴承的真实尺寸会有细微变化。矿井提升机故障模拟实验台数据由振动加速度传感器采集,传感器型号为CX-230,频响范围为0~40 kHz,采集设备为DH522型动态测试分析系统。

    图  9  提升机模拟实验台故障轴承
    Figure  9.  Fault bearing of mine hoist simulation experimental bench

    该实验设置了数据集A和B,CWRU实验数据详情见表2,矿井提升机故障模拟实验台采集轴承数据集见表3,使用凯斯西储大学数据集对VAE-WGAN进行测试,并通过量化指标评价VAE-WGAN生成能力的方式优选超参数,再用矿井提升机模拟实验台轴承数据集训练VAE-WGAN,实现小样本数据集增广扩容。在实验中,数据集A的内圈故障IF,外圈故障OF,滚动体故障BF和正常样本Normal均有500个灰度图样本,包含了不同故障直径和不同工况,总计2000个灰度图样本。数据集B为矿井提升机故障模拟实验台采集的轴承数据,其样本选取方式和样本构成与数据集A一致,用于训练VAE-WGAN生成高质量的故障样本数据。图10展示了数据集B中滚动体故障的一维时域振动信号、真实故障灰度图和生成故障灰度图。

    表  2  CWRU轴承数据集
    Table  2.  Experimental dataset of CWRU
    故障类型BFIFNormalOF
    数据集A500500500500
    下载: 导出CSV 
    | 显示表格
    表  3  矿井提升机故障模拟实验台轴承数据集
    Table  3.  Bearing dataset collected by mine hoist fault simulation experimental bench
    故障类型BFIFNormalOF
    数据集B500500500500
    下载: 导出CSV 
    | 显示表格
    图  10  滚动体故障时域波形图和灰度图
    Figure  10.  Time domain waveform and grayscale image of rolling element faults

    VAE-WGAN的编码器用于特征提取,输入为真实样本灰度图,输出为隐变量$z$。实验中,VAE-WGAN的编码器有4个卷积层(Conv)、1个扁平化层(Flatten)和1个全连接层(FC)。在编码器结构中,扁平化层的作用是将卷积层的多维输出降成一维,便于后续分类输出。全连接层的作用是输出隐变量z。除Flatten层外,所有层使用LeakyReLU进行激活,然后输入到BN层,以达到稀疏网络、增加网络非线性度、防止梯度消失或梯度爆炸的目的。

    VAE-WGAN的生成器用于将隐变量z重构为生成图像。实验中,VAE-WGAN的生成器设有3个反卷积层(DeConv)、1个FC层、1个重塑层(Reshape)和1个卷积层。在生成器中,反卷积层的作用是将隐变量z逐层重构,生成“假”图像。FC层的作用是对隐变量z进行特征映射。重塑层的作用是将一维向量Reshape成多维向量。除Conv层使用Sigmoid激活函数外,其他层使用LeakyReLU激活函数,并输入到BN层中。

    VAE-WGAN判别器的输入有两部分,一部分是真实灰度图像,另外一部分是生成器重构生成的灰度图像,输出为生成灰度图是否为真实灰度图的概率。实验中,VAE-WGAN的判别器有4个Conv层、1个Flatten层和和2个FC层。在判别器中,Flatten层的作用是将高维数据降成一维数据。最后1层FC层的神经元数量为1,用于判断生成灰度图像的“真”或“假”。

    VAE-WGAN的编码器、生成器及判别器具体参数见表4。其中,Filters为卷积核个数;filtrer_size为卷积核大小;strides为卷积步长;padding为边缘填充,其方式为SAME填充;Min_n dim为Flatten层的维度大小;units为FC层的神经元个数。

    表  4  VAE-WGAN模型具体参数
    Table  4.  Specific parameters of VAE-WGAN model
    模块 各层类型 参数
    编码器 Conv+BN+LReLU Filters:64,filtrer_size:5×5,strides:2,padding:SAME
    Conv+BN+LReLU Filters:128,filtrer_size:5×5,strides:2,padding:SAME
    Conv+BN+LReLU Filters:256,filtrer_size:5×5,strides:2,padding:SAME
    Conv+BN+LReLU Filters:256,filtrer_size:5×5,strides:2,padding:SAME
    Flatten Min_n dim:3
    FC+LReLU 512units
    生成器 FC+BN+LReLU 8×8×32×8 units
    Reshape Reshape_size:batch×8×8×256
    DeConv+BN+LReLU Filters:256,filtrer_size:5×5,strides:2,padding:SAME
    DeConv+BN+LReLU Filters:128,filtrer_size:5×5,strides:2,padding:SAME
    DeConv+BN+LReLU Filters:32,filtrer_size:5×5,strides:2,padding:SAME
    Conv+Sigmoid Filters:1,filtrer_size:5×5,strides:1,padding:SAME
    判别器 Conv+LReLU Filters:32,filtrer_size:5×5,strides:2,padding:SAME
    Conv+BN+LReLU Filters:128,filtrer_size:5×5,strides:2,padding:SAME
    Conv+BN+LReLU Filters:256,filtrer_size:5×5,strides:2,padding:SAME
    Conv+BN+LReLU Filters:256,filtrer_size:5×5,strides:1,padding:SAME
    Flatten Min_n dim:3
    FC+LReLU 256 units
    FC 1 units
    下载: 导出CSV 
    | 显示表格

    为了探究迭代次数Epochs和批处理大小Batch_size对VAE-WGAN生成效果的影响,本节拟在CWRU实验数据集上进行实验。本节分别设置2组实验:

    1)迭代次数对模型生成能力的影响:使用CWRU数据集中的A数据集对VAE-WGAN进行训练,并计算不同迭代次数生成故障样本的FID值和LPIPS值,并选出FID和LPIPS值最低的迭代次数Epochs;

    2)批处理大小对模型生成能力的影响;在(1)的基础上固定VAE-WGAN的迭代次数Epochs,训练并测试不同批处理大小生成故障样本的FID值和LPIPS值,并选出FID和LPIPS值最低的批处理大小Batch_size。

    在第1组实验中,将研究迭代次数对生成能力的影响。为了真实公平的比较不同迭代次数对VAE-WGAN生成效果的影响,设置VAE-WGAN中的其他超参数固定不变,仅改变迭代次数大小。将批处理大小设置为64,学习率为0.0001,设置VAE-WGAN目标损失函数3个权值分别为$ \alpha $=0.5、$ \beta $=0.25、$ \gamma $=0.25,设置编码器输出隐含变量z和解码器输入隐含变量z的长度均为512,且服从标准正态分布,同时引入权重裁剪方法将VAE-WGAN的参数权重限制在[−0.1,0.1]区间内。

    编码器和判别器的输入为$64 \times 64 \times 1$的灰度图。VAE-WGAN在不同故障,不同迭代次数真实故障样本和生成故障样本之间的FID和LPIPS值点线图如图11图12所示。

    图  11  不同迭代次数的FID值点线图
    Figure  11.  Point-line diagram of FID values with different iterations
    图  12  不同迭代次数的LPIPS值点线图
    Figure  12.  Point-line diagram of LPIPS values with different iterations

    图11可知,4种故障均在VAE-WGAN中进行了15万次迭代训练,从4种故障的FID值分布可以看出,BF、IF和OF故障在迭代次数达到9万和10万时,FID值降到最低。其中,BF故障FID值最低为18.5808,IF故障FID值最低为87.7444,OF故障FID值最低为85.6633。正常样本Normal在迭代次数达到9万时FID值最低,仅有129.6357。由于FID值表示的是生成样本分布与真实样本的特征向量之间距离的一种度量,且FID值越小,表示生成图片越多样、质量越好。因此,本组实验可以表明,当4种故障的迭代次数达到9万或10万时,生成样本和真实样本之间的分布距离最近,生成故障样本组成的数据集图片最多样、质量最好。

    基于LPIPS的图像相似度评估方法要求生成器学习从生成图像中反向映射回真实图像,并优先考虑它们之间的感知相似度,与人类的真实感知更为相似。LPIPS值通常在(0,1)之间,其值越低表示图像间的相似程度越高,最优情况下为0。由图12可以看出,在进行15万次迭代训练后,从4种故障的LPIPS值分布可以看出,IF和OF故障在迭代次数达到8万和9万时,IF故障LPIPS值最低为0.0976,OF故障LPIPS值 最低为0.0759。BF故障和正常样本Normal在迭代次数达到9万时LPIPS值最低,其数值分别为0.09190.0993。因此,本组实验可以表明,当4种故障的迭代次数达到8万或9万时,生成样本和真实样本之间的感知相似度最高。

    根据本组实验的结果可知,当迭代次数为9~10万时,生成故障样本和真实样本之间的FID值较为理想。当迭代次数为8~9万,生成故障样本和真实样本之间的LPIPS值较为理想。综合考虑,本节VAE-WGAN选取迭代次数Epochs=9×104作为本节样本增广模型的超参数之一。

    在第2组实验中,将探究批处理大小对模型生成能力的影响。在第1组实验的基础上,固定VAE-WGAN的迭代次数Epochs=9×104,训练并测试3种批处理大小(32,64,128)生成故障样本的FID值和LPIPS值,并选出FID值和LPIPS值最低的批处理大小Batch_size。VAE-WGAN的其他超参数同第一组实验一致。VAE-WGAN不同故障,不同批处理大小的真实故障样本和生成故障样本之间的FID值和LPIPS值点线图如图13图14所示。

    图  13  不同批处理大小的FID值点线图
    Figure  13.  Point-line diagram of FID value with different batch sizes
    图  14  不同批处理大小的LPIPS值点线图
    Figure  14.  Point-line diagram of LPIPS values with different batch sizes

    图13图14展示了VAE-WGAN不同批处理大小下生成故障样本灰度图像,仅凭肉眼无法分辨得出生成故障样本之间的区别。因此,需用FID值来评价生成故障样本的多样性和质量,用LPIPS值来评价真实故障样本和生成故障样本之间的感知相似度。

    图13的实验结果可以看出,在批处理大小Batch_size为64时,滚动体故障BF和内圈故障IF的FID值最低,分别仅有25.250689.1889,而其他两个Batch_size(32、128)生成故障样本的FID值均比Batch_size = 64时高。在批处理大小Batch_size为128时,正常样本Normal和外圈故障OF的FID值最低,分别仅有190.838796.1447,而其他两个Batch_size(32、64)生成故障样本的FID值均比Batch_size = 128时高。图13的实验表明,当Batch_size为64或128时,4种故障的FID值均维持在一个比较低的水平。

    LPIPS值的大小通常在(0,1)之间,从图14可以看出,在批处理大小Batch_size为32时,滚动体故障BF和正常样本Normal的LPIPS值最低,分别仅有0.09180.1021。在批处理大小Batch_size为64时,内圈故障IF和外圈故障OF的LPIPS值最低,分别仅有0.10590.0815图14的实验表明,当Batch_size为32或64时,4种故障的LPIPS值较低。

    综合考虑生成故障样本的多样性以及真实故障样本和生成故障样本之间的感知相似度,当批处理大小为64时,生成故障样本和真实样本之间的FID值和LPIPS值较为理想。因此,选取批处理大小64作为样本增广模型的超参数。

    为了验证VAE-WGAN+CBAM-MobileNetV2的小样本模式故障诊断方法能否克服故障样本匮乏问题,对矿井提升机故障模拟实验台采集轴承数据集进行测试,分别设置了2组实验。

    上节中,探究了迭代次数Epochs和批处理大小Batch_size对VAE-WGAN生成能力的影响,使用CWRU数据集进行了实验,发现当迭代次数Epochs=9×104,Batch_size=64时,生成故障样本的FID值和LPIPS值最低。因此,本组实验设置VAE-WGAN的超参数Epochs=9×104,Batch_size=64,将矿井提升机故障模拟实验台采集轴承数据集各类故障样本分别输入VAE-WGAN中进行对抗训练,提升机主轴承生成故障样本VAE-WGAN损失值变化曲线如图15所示。由图15a—图15d中VAE-WGAN的判别器和生成器损失变化曲线可知,4种故障样本在经过9×104个迭代次数训练后,判别器和生成器损失值趋近于0,VAE-WGAN 达到纳什均衡状态。本组通过矿井提升机故障模拟实验台原始故障样本和生成故障样本构建了小样本数据集B和小样本增广数据集B1,B2、B3和B4。在小样本模式下,CBAM-MobileNetV2超参数设置如下:Batch_size = 8,学习率LR = 0.001,Epochs = 600, 划分数据集80%为训练集,20%为测试集。损失函数设置为交叉熵损失函数,选用Adam优化算法。VAE-WGAN超参数设置如下:Batch_size = 64,迭代次数Epochs = 9×104,学习率LR = 0.0001,目标损失函数3个权值分别为$ \alpha $=0.5、$ \beta $=0.25、$ \gamma $=0.25,设置编码器输出隐含变量z的长度均为512,且服从标准正态分布。提升机主轴承小样本模式故障诊断结果见表5

    图  15  提升机主轴承生成故障样本的VAE-WGAN损失值变化曲线
    Figure  15.  VAE-WGAN loss value change curve of fault sample generated by host main bearing
    表  5  提升机主轴承小样本模式故障诊断结果
    Table  5.  Fault diagnosis results of hoist main bearing in small sample mode
    数据集 故障类型及样本数量 小样本比例
    (真实:生成)
    平均诊断准确率/%
    Normal BF IF OF
    数据集B 16 16 16 16 1 :0 66.31
    数据集B1 32 32 32 32 1 :1 70.83
    数据集B2 48 48 48 48 1 :2 87.50
    数据集B3 64 64 64 64 1 :3 91.96
    数据集B4 80 80 80 80 1 :4 93.75
    下载: 导出CSV 
    | 显示表格

    表5可以看出,在小样本情景(数据集B)下,仅使用小样本真实灰度图像的平均故障诊断准确率只有66.31%,在经VAE-WGAN进行样本增广后,故障诊断的平均准确率都有不同程度的提升。当真实故障样本与生成故障样本的比例为1∶4时,平均故障诊断准确率最高,达到了93.75%。实验结果表明,提出的VAE-WGAN+CBAM-MobileNetV2模型能够解决小样本故障诊断率低的问题。

    为了进一步验证所提故障诊断方法对小样本轴承故障诊断的优势,选取了VAE、WGAN、WGAN_GP和DCGAN 4种生成模型对提升机主轴承故障样本进行增广扩容,并结合CBAM-MobileNetV2分类器进行故障分类。其中,变分自编码器VAE是通过将故障样本进行解码后再编码重构故障样本;WGAN是在原始GAN中引入了Wasserstein距离;WGAN_GP为WGAN的变体,它在WGAN中引入了梯度惩罚,在实验中设置梯度惩罚因子$\lambda $=10;DCGAN为深度卷积生成对抗网络,它是CNN和GAN的结合体。上述方法在小样本数据集上的诊断准确率对比结果见表6

    表  6  各种方法在小样本数据集上的准确率(%)对比
    Table  6.  Comparison of accuracy of various methods on small sample datasets
    序号 方法 小样本比例(真实:生成)
    1∶1 1∶2 1∶3 1∶4
    1 DCGAN+CBAM-MobileNetV2 65.78 68.90 73.82 85.93
    2 WGAN_GP+CBAM-MobileNetV2 64.33 76.80 85.41 85.49
    3 WGAN+CBAM-MobileNetV2 61.66 78.13 74.33 81.25
    4 VAE+CBAM-MobileNetV2 66.67 84.38 85.42 82.81
    5 VAE-WGAN+CBAM-MobileNetV2(本文方法) 70.83 87.50 91.96 93.75
    下载: 导出CSV 
    | 显示表格

    表6可以看出,当小样本比例为1∶1时,方法3的准确率最低,仅有61.66%,方法1、方法2和方法4的准确率均在70%以下,而提出的VAE-WGAN+CBAM-MobileNetV2方法达到了70.83%,高于其他4种方法。当小样本比例为1∶2时,方法4和提出的VAE-WGAN+CBAM-MobileNetV2的准确率均在80%以上,表现优于其他3种方法,方法4仅比VAE-WGAN+CBAM-MobileNetV2低了3.12%。当小样本比例为1∶3和1∶4时,VAE-WGAN+CBAM-MobileNetV2的准确率超过了90%,达到了93.75%。整体来看,不同的生成对抗网络达到最优时所对应的小样本比例不同,例如,方法4在小样本比例为1∶3时最优,方法1、方法2和方法3在小样本比例为1∶4时最优。而所提方法VAE-WGAN+CBAM-MobileNetV2在4种小样本比例数据集上的准确率均高于其他4种方法,当小样本比例为1∶4时最优,高达93.75%,诊断效果明显好于其他几种对比方法。

    1)样本增广模型VAE-WGAN引入了Wasserstein距离度量数据分布间的距离,解决了原始VAE-GAN使用JS散度测量真实数据和生成数据间的分布距离而导致训练梯度消失的问题。此外,笔者在VAE-WGAN中引入了权重裁剪方法将参数权重限制在一定区间内,增强了网络的表现能力,提高了训练过程中的稳定性。

    2)为了提升故障诊断模型的特征提取能力,从而提高模型的故障诊断准确率,在轻量化卷积神经网络MobileNetV2的基础上,融合了卷积块注意力模块CBAM。CBAM是通过跨通道信息和空间信息混合在一起来提取特征的,其能够更多地关注故障特征,进而提高模型的特征提取能力,提高卷积神经网络的分类精度。

    3)与WGAN_GP、DCGAN,VAE以及WGAN等传统生成模型相比,所提基于VAE-WGAN的矿井提升机主轴承小样本故障诊断方法在不同小样本比例故障数据集上诊断准确率更高,能够满足故障样本匮乏下的准确诊断要求,同时模拟实验也验证了所提方法的有效性,为提升机主轴承小样本故障诊断提供了理论依据和思路借鉴。

  • 图  1   VAE-WGAN模型详细结构

    Figure  1.   Detailed structure of VAE-WGAN model

    图  2   ResNet残差块和MobileNetV2倒残差块

    Figure  2.   ResNet residual block and MobileNetV2 inverted residual block

    图  3   CBAM结构原理

    Figure  3.   Schematic diagram of CBAM structure

    图  4   振动信号的灰度图变换

    Figure  4.   Grayscale image transformation of vibration signals

    图  5   LPIPS计算过程示意

    Figure  5.   Schematic diagram of LPIPS calculation process

    图  6   CBAM-MobileNetV2结构

    Figure  6.   Structure diagram of CBAM-MobileNetV2

    图  7   VAE-GAN +CBAM-MobileNetV2诊断算法训练流程

    Figure  7.   Diagnostic algorithm training process of VAE-GAN+CBAM-MobileNetV2

    图  8   CWRU轴承采样实验平台和矿井提升机故障模拟实验台

    Figure  8.   CWRU bearing sampling experimental platform and mine hoist fault simulation experimental bench

    图  9   提升机模拟实验台故障轴承

    Figure  9.   Fault bearing of mine hoist simulation experimental bench

    图  10   滚动体故障时域波形图和灰度图

    Figure  10.   Time domain waveform and grayscale image of rolling element faults

    图  11   不同迭代次数的FID值点线图

    Figure  11.   Point-line diagram of FID values with different iterations

    图  12   不同迭代次数的LPIPS值点线图

    Figure  12.   Point-line diagram of LPIPS values with different iterations

    图  13   不同批处理大小的FID值点线图

    Figure  13.   Point-line diagram of FID value with different batch sizes

    图  14   不同批处理大小的LPIPS值点线图

    Figure  14.   Point-line diagram of LPIPS values with different batch sizes

    图  15   提升机主轴承生成故障样本的VAE-WGAN损失值变化曲线

    Figure  15.   VAE-WGAN loss value change curve of fault sample generated by host main bearing

    表  1   MobileNetV2 整体网络结构配置

    Table  1   Overall network structure configuration of MobileNetV2

    Input Operator t c n s
    2242×3 Conv2d - 32 1 2
    1122×32 bottleneck 1 16 1 1
    1122×16 bottleneck 6 24 2 2
    562×24 bottleneck 6 32 3 2
    282×32 bottleneck 6 64 4 2
    142×64 bottleneck 6 96 3 1
    142×96 bottleneck 6 160 3 2
    72×160 bottleneck 6 320 1 1
    72×320 Conv2d 1×1 - 1280 1 1
    72×1280 Avgpool 7×7 - - 1 1
    1×1×1280 Conv2d 1×1 - k - -
    下载: 导出CSV

    表  2   CWRU轴承数据集

    Table  2   Experimental dataset of CWRU

    故障类型BFIFNormalOF
    数据集A500500500500
    下载: 导出CSV

    表  3   矿井提升机故障模拟实验台轴承数据集

    Table  3   Bearing dataset collected by mine hoist fault simulation experimental bench

    故障类型BFIFNormalOF
    数据集B500500500500
    下载: 导出CSV

    表  4   VAE-WGAN模型具体参数

    Table  4   Specific parameters of VAE-WGAN model

    模块 各层类型 参数
    编码器 Conv+BN+LReLU Filters:64,filtrer_size:5×5,strides:2,padding:SAME
    Conv+BN+LReLU Filters:128,filtrer_size:5×5,strides:2,padding:SAME
    Conv+BN+LReLU Filters:256,filtrer_size:5×5,strides:2,padding:SAME
    Conv+BN+LReLU Filters:256,filtrer_size:5×5,strides:2,padding:SAME
    Flatten Min_n dim:3
    FC+LReLU 512units
    生成器 FC+BN+LReLU 8×8×32×8 units
    Reshape Reshape_size:batch×8×8×256
    DeConv+BN+LReLU Filters:256,filtrer_size:5×5,strides:2,padding:SAME
    DeConv+BN+LReLU Filters:128,filtrer_size:5×5,strides:2,padding:SAME
    DeConv+BN+LReLU Filters:32,filtrer_size:5×5,strides:2,padding:SAME
    Conv+Sigmoid Filters:1,filtrer_size:5×5,strides:1,padding:SAME
    判别器 Conv+LReLU Filters:32,filtrer_size:5×5,strides:2,padding:SAME
    Conv+BN+LReLU Filters:128,filtrer_size:5×5,strides:2,padding:SAME
    Conv+BN+LReLU Filters:256,filtrer_size:5×5,strides:2,padding:SAME
    Conv+BN+LReLU Filters:256,filtrer_size:5×5,strides:1,padding:SAME
    Flatten Min_n dim:3
    FC+LReLU 256 units
    FC 1 units
    下载: 导出CSV

    表  5   提升机主轴承小样本模式故障诊断结果

    Table  5   Fault diagnosis results of hoist main bearing in small sample mode

    数据集 故障类型及样本数量 小样本比例
    (真实:生成)
    平均诊断准确率/%
    Normal BF IF OF
    数据集B 16 16 16 16 1 :0 66.31
    数据集B1 32 32 32 32 1 :1 70.83
    数据集B2 48 48 48 48 1 :2 87.50
    数据集B3 64 64 64 64 1 :3 91.96
    数据集B4 80 80 80 80 1 :4 93.75
    下载: 导出CSV

    表  6   各种方法在小样本数据集上的准确率(%)对比

    Table  6   Comparison of accuracy of various methods on small sample datasets

    序号 方法 小样本比例(真实:生成)
    1∶1 1∶2 1∶3 1∶4
    1 DCGAN+CBAM-MobileNetV2 65.78 68.90 73.82 85.93
    2 WGAN_GP+CBAM-MobileNetV2 64.33 76.80 85.41 85.49
    3 WGAN+CBAM-MobileNetV2 61.66 78.13 74.33 81.25
    4 VAE+CBAM-MobileNetV2 66.67 84.38 85.42 82.81
    5 VAE-WGAN+CBAM-MobileNetV2(本文方法) 70.83 87.50 91.96 93.75
    下载: 导出CSV
  • [1] 张宏乐,韩雪华,史凯,等. 基于深度迁移学习的提升机主轴故障在线诊断系统研究[J]. 煤炭工程,2022,54(7):61−66.

    ZHANG Hongle,HAN Xuehua,SHI Kai,et al. Online fault diagnosis system of hoist bearing based on deep transfer learning[J]. Coal Engineering,2022,54(7):61−66.

    [2] 李娟莉,赵旭荣,孙梦祯. 矿井提升机主轴系统故障本体诊断方法[J]. 矿业研究与开发,2020,40(6):144−147.

    LI Juanli,ZHAO Xurong,SUN Mengzhen. Fault ontology diagnosis method of spindle system of mine hoist[J]. Mining Research and Development,2020,40(6):144−147.

    [3] 张梦瑜. 矿井提升机电控系统的研究与设计[J]. 机械管理开发,2022,37(3):275−276,279.

    ZHANG Mengyu. Research and design of electric control system for mine hoist[J]. Mechanical Management and Development,2022,37(3):275−276,279.

    [4] 张宏乐,韩雪华,史凯,等. 基于深度迁移学习的提升机主轴故障在线诊断系统研究[J]. 煤炭工程,2022,54(7):61−66.

    ZHANG Hongle,HAN Xuehua,SHI Kai,et al. Online fault diagnosis system of hoist bearing based on deep transfer learning[J]. Coal Engineering,2022,54(7):61−66.

    [5] 杨光友,刘浪,习晨博. 自适应辅助分类器生成式对抗网络样本生成模型及轴承故障诊断[J]. 中国机械工程,2022,33(13):1613−1621.

    YANG Guangyou,LIU Lang,XI Chenbo. Bearing fault diagnosis based on SA-ACGAN data generation model[J]. China Mechanical Engineering,2022,33(13):1613−1621.

    [6] 郭伟,邢晓松. 基于改进卷积生成对抗网络的少样本轴承智能诊断方法[J]. 中国机械工程,2022,33(19):2347−2355. doi: 10.3969/j.issn.1004-132X.2022.19.009

    GUO Wei,XING Xiaosong. Intelligent fault diagnosis of bearings with few samples based on an improved convolutional generative adversarial network[J]. China Mechanical Engineering,2022,33(19):2347−2355. doi: 10.3969/j.issn.1004-132X.2022.19.009

    [7]

    CRESWELL A,WHITE T,DUMOULIN V,et al. Generative adversarial networks:An overview[J]. IEEE Signal Processing Magazine,2018,35(1):53−65. doi: 10.1109/MSP.2017.2765202

    [8] 陈其. 改进GAN结合SDAE的传动系统主轴承故障诊断[J]. 微特电机,2023,51(2):20−25.

    CHEN Qi. Fault diagnosis of main bearing of transmission system based on ACGAN-SDAE[J]. Small & Special Electrical Machines,2023,51(2):20−25.

    [9]

    PLAKIAS S,BOUTALIS Y S. Exploiting the generative adversarial framework for one-class multi-dimensional fault detection[J]. Neurocomputing,2019,332:396−405. doi: 10.1016/j.neucom.2018.12.041

    [10]

    DING Y,MA L,MA J,et al. A generative adversarial network-based intelligent fault diagnosis method for rotating machinery under small sample size conditions[J]. IEEE Access,2019,7:149736−149749. doi: 10.1109/ACCESS.2019.2947194

    [11]

    ARJOVSKY M,CHINTALA S,BOTTOU L,et al. Wasserstein generative adversarial networks[C]//Proceedings of the 34th International Conference on Machine Learning - Volume 70. New York:ACM,2017:214−223.

    [12]

    QI Guojun. Loss-sensitive generative adversarial networks on lipschitz densities[J]. International Journal of Computer Vision,2020,128(5):1118−1140. doi: 10.1007/s11263-019-01265-2

    [13] 徐卓飞,李旭东,张婵婵,等. 基于孪生网络的小样本滚动轴承故障诊断研究[J]. 仪器仪表学报,2022,43(10):241−251.

    XU Zhuofei,LI Xudong,ZHANG Chanchan,et al. Fault diagnosis of rolling bearings with limited samples based on Siamese network[J]. Chinese Journal of Scientific Instrument,2022,43(10):241−251.

    [14]

    LARSEN A B L, SØNDERBY S K, LAROCHELLE H, et al. Autoencoding beyond pixels using a learned similarity metric[EB/OL]. (2016‒02‒10) [2023‒08‒20]. https://arxiv.org/abs/1512.09300v2.

    [15]

    MOZTARZADEH O,JAMSHIDI M B,SARGOLZAEI S,et al. Metaverse and medical diagnosis:A blockchain-based digital twinning approach based on MobileNetV2 algorithm for cervical vertebral maturation[J]. Diagnostics,2023,13(8):1485. doi: 10.3390/diagnostics13081485

    [16]

    LIU Jiansheng,CUI Guolong,XIAO Chengdi. A real-time and efficient surface defect detection method based on YOLOv4[J]. Journal of Real-Time Image Processing,2023,20(4):77. doi: 10.1007/s11554-023-01333-4

    [17] 李炳臻,刘克,顾佼佼,等. 卷积神经网络研究综述[J]. 计算机时代,2021(4):8−12,17.

    LI Bingzhen,LIU Ke,GU Jiaojiao,et al. Review of the researches on convolutional neural networks[J]. Computer Era,2021(4):8−12,17.

    [18]

    PANG Bo. Classification of images using EfficientNet CNN model with convolutional block attention module (CBAM) and spatial group-wise enhance module (SGE)[C]//International Conference on Image,Signal Processing,and Pattern Recognition (ISPP 2022).Washington: SPIE,2022.

    [19] 姚齐水,别帅帅,余江鸿,等. 一种结合改进Inception V2模块和CBAM的轴承故障诊断方法[J]. 振动工程学报,2022,35(4):949−957.

    YAO Qishui,BIE Shuaishuai,YU Jianghong,et al. A bearing fault diagnosis method combining improved inception V2 module and CBAM[J]. Journal of Vibration Engineering,2022,35(4):949−957.

    [20] 王生霄,侯兴松,黑夏萌. 嵌入CBAM结构的改进YOLOV3超宽带雷达生命信号检测算法[J]. 国外电子测量技术,2020,39(3):1−6.

    WANG Shengxiao,HOU Xingsong,HEI Xiameng. Improved YOLOV3 UWB radar life signal detection algorithm embedded in CBAM structure[J]. Foreign Electronic Measurement Technology,2020,39(3):1−6.

    [21] 任治洲,梁琨,王泽宇等. 结合改进CBAM和MobileNet V2算法对小麦病斑粒分类[J]. 南京农业大学学报,2023,47(3):583−591.

    REN Zhizhou,LIANG Kun,WANG Zeyu,et al. Combining improved CBAM and MobileNet V2 algorithms for classifying diseased wheat kernels[J]. Journal of Nanjing Agricultural University,2023,47(3):583−591

    [22]

    CHONG M J,FORSYTH D. Effectively unbiased FID and inception score and where to find them[C]//2020 IEEE/CVF Conference on Computer Vision and Pattern Recognition (CVPR). Piscataway,NJ:IEEE,2020:6069−6078.

    [23]

    ZHANG R,ISOLA P,EFROS A A,et al. The unreasonable effectiveness of deep features as a perceptual metric[C]//2018 IEEE/CVF Conference on Computer Vision and Pattern Recognition. Piscataway,NJ:IEEE,2018:586−595.

图(15)  /  表(6)
计量
  • 文章访问数:  42
  • HTML全文浏览量:  20
  • PDF下载量:  25
  • 被引次数: 0
出版历程
  • 收稿日期:  2023-10-18
  • 网络出版日期:  2025-01-10

目录

/

返回文章
返回