矿用提升机作为煤矿生产的“咽喉”设备,承担着人员、煤炭及设备的垂直运输重任,其健康状态直接关乎矿井生产安全与效率。提升机运行时,驱动电机、齿轮箱等部件产生的噪声中蕴含着丰富的运行状态信息,其中噪声频谱的能量脊变化趋势是判断设备健康状况的关键指标。然而,背景噪声干扰导致能量脊边界模糊、连续性差,传统检测方法难以精准提取。近日,AIMC LAB团队提出的DeepRidge深度学习模型,成功破解这一难题,相关成果发表于《International Journal of Innovative Computing, Information and Control》。

行业痛点:能量脊检测的“双重困境”

提升机噪声频谱可视为三维结构,其能量脊是频率带周期性变化形成的能量集中区域,通过分析能量脊的陡峭度变化能实现设备健康预判。但实际检测中面临两大核心难题:一是噪声干扰严重,不同频段能量分布差异极大,滤波处理易丢失细节信息,导致能量脊可见性和清晰度极低;二是传统方法适配性差,能量脊局部呈不连续边缘、全局为连续线结构,传统线检测或边缘检测模型难以兼顾全局关联与局部细节,无法有效提取完整脊线。

例如提升机匀速运行阶段的频谱图显示,低频与高频段能量分布悬殊,背景噪声颗粒会降低脊线对比度并破坏其连续性(如图1、图2所示),传统基于梯度或霍夫变换的方法在此类场景下漏检、误检率极高。

图1 提升机运行噪声频谱图

图2 提升机匀速阶段能量分布

核心创新:DeepRidge模型的“多尺度融合+注意力增强”设计

受人类观察模糊图像时“先全局概览再局部确认”的认知逻辑启发,研究团队基于SegNet语义分割网络,设计了端到端的DeepRidge模型,通过多编码器-注意力模块-解码器块提取并融合多尺度特征,实现能量脊的精准检测。模型核心架构如图3所示。

图3 五层DeepRidge模型架构图

1. 编码器-解码器注意力连接结构:兼顾特征提取与细节保留

模型以倒置残差结构构建编码器与解码器:编码器通过1×1卷积降维、3×3卷积提取特征、2×2最大池化下采样,同时保存池化索引用于后续上采样;解码器基于编码器保存的索引进行非线性上采样,恢复特征图尺寸后通过卷积层融合特征。关键创新在于引入注意力门模块,将每对编码器与解码器的最后一层卷积特征进行融合,通过生成门控信号调节不同空间位置特征的重要性,选择性提取关键信息并抑制无关背景噪声。

为适配嵌入式部署,模型还做了针对性优化:维度约简卷积采用线性激活函数避免信息丢失,其他卷积层采用ReLU6替代ReLU,限制输出值范围以适配低精度浮点数运算;最大池化层的引入不仅扩大感受野,更实现降维减参,提升模型运行效率。编码器-解码器具体结构如图4所示。

图4 编码器-解码器结构示意图

2. 多尺度特征融合:全局与局部信息的精准协同

模型构建多组编码器-解码器对形成不同尺度的搜索域:小尺度特征图用于能量脊的粗定位,捕捉全局连续特征;大尺度特征图用于细优化,补充局部细节信息。所有尺度的融合特征图经输出模块汇总后,生成最终检测结果。这种多尺度融合策略完美匹配能量脊“局部不连续、全局连续”的结构特性,大幅提升检测鲁棒性。

3. 损失函数设计:适配像素级二分类任务

能量脊检测本质是像素级二分类问题(判断像素是否位于脊线上),模型采用基于二元交叉熵的损失函数,以人工标注的脊线图为真值,通过对数损失衡量预测结果与真值的差异,引导模型学习脊线的像素级特征。

实验验证:精度与轻量化性能双优

1. 实验设计:真实数据集+多维度评价

实验数据来源于淮南矿业集团丁集煤矿主井提升机的噪声采集,经短时傅里叶变换生成纵向分辨率为416的频谱图,分割为416×416的图像块后人工标注真值,最终构建含396个训练样本、180个测试样本的数据集。训练基于PyTorch框架,采用RMSProp优化器,以ODS(最优数据集尺度F值)、OIS(最优图像尺度F值)、AP(平均精度)、计算量(FLOPs)和参数量为核心评价指标,对比SegNet、Attention U-Net、DeepCrack、U-Net等主流模型性能。

2. 核心性能:精度与轻量化优势显著

定量对比结果显示,DeepRidge模型综合性能最优(如表1所示):ODS达0.87,AP达0.82577,虽ODS略低于DeepCrack(0.93),但AP高出14.01个百分点,检测精度更优;同时模型参数量仅11.66百万,计算量105452百万次,较DeepCrack分别降低62.3%和70.8%,轻量化优势突出,为嵌入式部署奠定基础。

方法OISODSAP计算量/百万次参数量/百万
DeepRidge0.880.870.82577105,45211.66
U-Net0.460.450.4327981,97413.39
Attention U-Net0.440.420.65501241,00442.88
SegNet0.700.680.5946277,02718.81
DeepCrack0.910.930.68546361,04930.90

表1 五种深度学习模型定量评价结果

精度-召回曲线(PR曲线)进一步验证了模型性能,DeepRidge曲线更贴近右上角,表明在不同召回率下均保持高精准度(如图5所示)。可视化结果显示,DeepRidge能有效规避背景噪声干扰,完整提取能量脊线,而对比模型存在不同程度的断裂或误检现象。

图5 测试集上五种模型的PR曲线

3. 模型配置优化:确定最优架构

为找到最优配置,研究团队设计了四种不同结构的DeepRidge模型(表2),通过对比测试发现“标准版”(5组编码器-解码器对)性能最佳:ODS达0.87,AP达0.82577。增加编码器-解码器对(深度版)会因小尺度特征图信息不足降低精度,减少对(浅滩版)则因缺失关键尺度特征导致性能下降,增加卷积层(厚重版)易引发过拟合。

模型类型编码器-解码器对数量
DeepRidge-Shoal(浅滩版)标准版4
DeepRidge-Standard(标准版)标准版5
DeepRidge-Heavy(厚重版)厚重版5
DeepRidge-Deep(深度版)标准版6

表2 不同配置的DeepRidge模型参数

4. 嵌入式部署:兼顾精度与速度

为实现提升机旁原位分析,团队在瑞芯微RK3588S嵌入式平台(6TOPS算力NPU)上对模型进行优化,通过张量操作重构不支持的MaxUnpool2d算子,并测试不同量化方式的性能。结果显示(表3),混合量化模型在保持较高精度(ODS=0.851,AP=0.7675)的同时,推理速度达0.85417秒/帧,较浮点32位模型提升30%,完全满足现场实时检测需求。

参数Float32(浮点32位)Int8(整型8位)混合量化
OIS0.8620.810.854
ODS0.8470.790.851
AP0.80260.64710.7675
单帧耗时/秒1.1967430.7765060.85417

表3 DeepRidge在RK3588S平台的量化性能测试

研究意义与未来展望

DeepRidge模型的创新之处在于:通过注意力增强的多尺度特征融合,突破了噪声干扰下能量脊检测的精度瓶颈;同时采用轻量化设计,实现嵌入式平台实时部署,为提升机健康监测提供了“精准检测+原位分析”的一体化解决方案。研究构建的提升机噪声频谱数据集及核心代码已开源至GitHub,为行业研究提供重要支撑。

未来,团队计划将DeepRidge与能量脊陡峭度分析算法结合,建立“脊线提取-特征分析-故障预警”的全流程模型,实现提升机早期故障的精准预判;同时拓展模型在风机、水泵等其他煤矿关键设备故障检测中的应用,推动煤矿智能化监测技术升级。

Avatar photo

作者 skyate

发表回复