(论文速读)基于扩散模型潜变量的旋转机械健康监测与早期故障检测方法 📅 2026/7/4 3:33:13 论文题目A health monitoring and early fault detection method of rotating machines based on latent variables of diffusion model基于扩散模型潜变量的旋转机械健康监测与早期故障检测方法期刊Mechanical Systems and Signal Processing 2025摘要深度生成模型在旋转机械的智能状态监测中得到了突出的应用主要利用重构误差作为健康指标(HIS)来表示实际的健康状况。这种构建HIS的方法极大地影响了健康监测和早期故障检测的健壮性和有效性。潜在变量(LV)的加入被认为是为了缓解这些挑战。尽管如此现有的深度生成模型的有限建模能力限制了它们捕获复杂模式的能力。对此本文提出了一种利用扩散模型中的潜在变量进行健康监测和故障预测的新方法。设计了一种基于多头自我注意机制(MHSA)的网络结构以有效地将时间序列监测数据映射到潜在空间。扩散模型最初是使用健康监测样本进行训练的。随后对于每个监测样本帧分析监测样本和健康样本在潜在空间中的分布差异以构建HIS。针对多个场景中的基线模型对我们提出的方法进行了全面的定量和定性比较。结果表明该方法在旋转机械状态监测和故障预测中具有良好的稳健性和有效性。用扩散模型的潜变量做旋转机械健康监测——LV-MHSA-Diffusion 详解1. 研究背景与动机旋转机械轴承、齿轮、传动轴等是工业系统的核心部件。对它们进行健康监测Health Monitoring和早期故障检测Early Fault Detection能够在故障真正发生之前发现隐患从而保障设备全寿命周期的安全运行。目前主流的智能监测方法可以分为两大类信号处理类方法依赖先验故障知识对特定部件效果好但泛化能力有限。AI 类方法以深度生成模型为代表无需大量有标签数据仅用健康样本训练对高维数据处理能力强近年来受到广泛关注。在 AI 类方法中研究者通常用健康指标Health IndicatorHI来定量描述设备的健康状态。HI 的构建质量直接决定了监测系统的鲁棒性和有效性。2. 现有方法存在的核心问题论文系统梳理了当前深度生成模型在 HI 构建中面临的三大瓶颈问题一基于重建误差的 HI 受噪声干扰现有方法包括 VAE、GAN通常以数据空间中生成样本与原始样本之间的分布差异作为 HI例如重建误差和对数似然函数。然而原始监测信号本身含有噪声生成过程也存在时延这些因素会污染 HI 的构建使其偏离设备真实健康状态。问题二VAE 和 GAN 的潜变量空间表达能力有限VAE使用单一正态分布对编码/生成过程建模表达复杂数据分布的能力不足GAN训练过程不稳定生成器与判别器之间的平衡难以维持模式坍塌问题。两者的潜变量LV数量有限限制了模型对设备真实健康状态变化的精细刻画能力。问题三扩散模型的潜变量用于健康监测尚未被系统开发扩散模型DDPM具备多步骤、多潜变量的丰富潜空间在图像生成等任务上已取得优异表现理论上更适合构建 HI。但目前将其潜变量用于旋转机械健康监测的研究几乎空白。此外DDPM 原始骨干网络U-Net主要为图像分割设计对工业监测信号这类长时序数据的上下文信息和时间依赖性捕捉能力不足亟需专门的网络结构设计。3. 论文提出的方法LV-MHSA-Diffusion针对上述三大问题论文提出了一套完整的健康监测框架核心创新点如下3.1 创新点一用 MHSA 替换 U-Net 作为扩散模型骨干网络论文设计了基于多头自注意力机制Multi-Head Self-AttentionMHSA的网络结构用于替代 DDPM 中的 U-Net以更好地处理时序监测数据。网络结构如下输入层接受时序监测样本Case I 维度为 512Case II 维度为 1024时间嵌入Time Embedding对扩散时间步 t 进行编码与输入特征融合两层 MHSA 模块每层包含 LayerNorm → MHSA8个注意力头→ Linear → SiLU → LayerNorm输出层预测每一步加入的噪声配图位置Fig. 6Case I 网络结构图和 Fig. 13Case II 网络结构图训练目标与标准 DDPM 一致最小化预测噪声与真实噪声之间的 L2 距离3.2 创新点二基于潜变量分布差异构建 HI这是本文最核心的思想。核心假设扩散模型在健康样本上训练完成后若输入的监测样本健康反向去噪过程能顺利恢复原始信号前向与反向转移概率之间的 KL 散度较小若输入的监测样本出现故障去噪过程受到干扰KL 散度增大。因此对第 n 帧监测样本计算每个扩散时间步 t 的分布差异对所有时间步求均值得到第 n 帧的 HI这种构建方式完全在潜变量空间进行避免了重建误差中数据空间噪声的干扰同时利用了扩散模型远比 VAE/GAN 更丰富的多步潜变量。3.3 方法整体流程整个 LV-MHSA-Diffusion 框架分为三个阶段① 数据采集与预处理将振动信号裁剪为多个时序片段构建健康样本集。② 扩散模型训练仅用健康样本通过前向加噪和反向去噪两个子过程训练 MHSA 扩散模型。③ HI 构建与应用对每帧监测数据计算潜变量空间的 KL 散度生成 HI 序列用于健康监测和早期故障检测。配图位置Fig. 3LV-MHSA-Diffusion 整体工作流程图4. 实验验证论文设计了两个案例进行验证覆盖了仿真和真实工况两种场景。4.1 案例一轴承故障仿真数据集实验设置基于滚动轴承外圈故障动力学仿真模型生成数据集。通过设定不同的外圈缺陷深度构建对应不同健康等级的振动响应配图位置Fig. 4外圈故障仿真模型示意图编号缺陷深度×10⁻⁶ m健康状态样本数量10.001健康40020.01Level 140030.1Level 240040.5Level 340051.0Level 4400配表位置Table 2实验参数设置仿真参数采样频率 20000 Hz转速 2000 rpm每段样本长 512 点见原文 Table 1。配表位置Table 1仿真参数为测试鲁棒性在原始信号中叠加不同信噪比SNR no noise / 1dB / −5dB的高斯白噪声。结果一HI 单调性验证计算每个扩散时间步的分布差异可观察到随故障等级增加曲线整体呈上升趋势。由此构建的 HI 随缺陷深度单调递增与退化真值高度一致。配图位置Fig. 7分布差异曲线及 HI 结果结果二鲁棒性对比定性将本文方法与5个基线模型Anomaly-Transformer、LSTM-AE-OC-SVM、WGDT、STGAT-MAD、OmniAnomaly在不同 SNR 下的 HI 曲线进行对比。从结果可以看出即使在强噪声环境SNR −5dB下本文方法的 HI 曲线仍能保持与退化过程一致的单调趋势且各损伤等级下的误差带error band明显小于其他基线方法。配图位置Fig. 8各方法在不同噪声下的 HI 曲线对比共6幅子图结果三鲁棒性对比定量采用余弦相似度Cosine Similarity衡量构建的 HI 与缺陷深度真值之间的一致性方法1dB−5dBLV-MHSA-Diffusion本文0.990.33Anomaly-Transformer0.980.86LSTM-AE-OC-SVM0.980.89WGDT0.980.86STGAT-MAD0.990.52OmniAnomaly0.40.88配图位置Fig. 9余弦相似度定量对比柱状图在强噪声−5dB场景下各基线方法性能均有明显下降而本文方法保持了相对较优的表现体现了潜变量 HI 构建策略在抗噪方面的优势。结果四消融实验将本文方法与以下四种变体进行对比LV-MHSA-Diffusion本文MHSA LVReconstruction-MHSA-DiffusionMHSA 重建误差LV-DDPMU-Net LVReconstruction-DDPMU-Net 重建误差配图位置Fig. 10消融实验余弦相似度对比结论无论采用哪种网络结构基于 LV 的 HI 均优于基于重建误差的 HI验证了潜变量策略的核心价值。MHSA 与 U-Net 在健康监测性能上相近但在推理速度上差异显著网络结构FPS帧/秒U-NetDDPM111.11MHSA本文502.51配表位置Table 3FPS 对比MHSA 结构的推理速度约为 U-Net 的4.5 倍在 NVIDIA RTX 4090 上测得极大地提升了实时监测的可行性。4.2 案例二真实轴承退化实验IMS 数据集实验设置采用广泛使用的IMS 轴承数据集进行验证。测试台由电机驱动4个 Rexnord ZA-2115 滚动轴承并联安装在同一轴上加速度传感器安装在轴承座处采样频率 20 kHz。配图位置Fig. 11IMS 测试台实物图与示意图使用第2子数据集共984帧监测数据每帧包含4个通道每通道 20480 个数据点。第984帧采集后检查发现1号轴承外圈损坏。考虑到实际工况下测点距故障源有一定距离选用距故障最远的3号轴承数据进行分析模拟实际场景中传感器不在故障点正上方的情形。训练集前 200 帧健康状态每帧切分为 20 个样本每样本 1024 点相邻样本有重叠共 1000 个训练样本保留一定时序信息。配图位置Fig. 12数据分割策略示意图轴承几何参数节圆直径 71.5mm滚子直径 8.4mm滚子数 16接触角 15.17°见原文 Table 4。配表位置Table 4轴承几何参数结果一潜变量分布差异可视化提取第1帧健康和第984帧故障的曲线两者呈现明显不同的形状验证了用潜变量分布差异构建 HI 的可行性。配图位置Fig. 14健康与故障样本的曲线对比结果二健康监测效果对比定性与 Case I 相同的基线模型进行对比。本文方法在轴承健康阶段 HI 波动更小故障发生后 HI 上升更明显健康状态刻画更准确。配图位置Fig. 15各方法 HI 曲线随时间变化对比共6幅子图结果三早期故障检测定量对比采用以 AE-LSTM-OCSVM 方法检测到的故障时刻为基准阈值策略统一为其中和分别为健康阶段 HI 的均值和标准差。方法AUROCAUPRC早期检测提前帧数AE-LSTM-OCSVN0.600.170基准Anomaly-Transformer0.750.280WGDT0.760.300OmniAnomaly0.620.210STGAT-MAD0.770.7878LV-MHSA-Diffusion本文0.810.8283配表位置Table 5定量对比结果本文方法在 AUROC、AUPRC 和早期检测提前帧数三项指标上均取得最优表现比基准方法提前83帧检测到早期故障。结果四消融实验Case II对比四种 HI 构建方式LV-MHSA、DDPM-Rec、DDPM-LVM、DDPM-Rec在真实退化数据上的 HI 曲线基于 LV 的方法无论 MHSA 还是 U-Net均能反映轴承退化的上升趋势本文的 MHSA LV 方法在退化过程中 HI 波动最小退化跟踪性能最优。配图位置Fig. 16消融实验 HI 曲线4幅子图5. 总结与展望核心贡献回顾创新点内容网络结构用 MHSA 替换 U-Net专门适配时序监测数据推理速度提升约 4.5 倍HI 构建策略首次将扩散模型的多步潜变量分布差异用于旋转机械 HI 构建规避重建误差的噪声干扰系统验证在仿真和真实数据集上均超越5个主流基线方法定量和定性结果一致方法优势更强的抗噪能力在 −5dB 强噪声下仍能有效跟踪退化趋势。更早的故障检测在 IMS 数据集上比基准方法提前 83 帧检出故障。更快的推理速度MHSA 结构在 RTX 4090 上达到 502.51 FPS满足实时监测需求。无监督学习仅需健康样本训练无需故障标签符合工业场景中故障样本稀少的实际情况。未来工作作者指出目前方法在潜变量可解释性方面仍有提升空间。未来研究将聚焦于如何增强 LV 衍生 HI 的可解释性使工程师能够更直观地理解潜变量与物理故障模式之间的对应关系。