矿用提升机作为煤矿生产的“咽喉”设备,承担着人员、煤炭及设备的垂直运输重任,其健康状态直接关乎矿井生产安全与效率。提升机运行时,驱动电机、齿轮箱等部件产生的噪声中蕴含着丰富的运行状态信息,其中噪声频谱的能量脊变化趋势是判断设备健康状况的关键指标。然而,背景噪声干扰导致能量脊边界模糊、连续性差,传统检测方法难以精准提取。近日,AIMC LAB团队提出的DeepRidge深度学习模型,成功破解这一难题,相关成果发表于《International Journal of Innovative Computing, Information and Control》。
行业痛点:能量脊检测的“双重困境”
提升机噪声频谱可视为三维结构,其能量脊是频率带周期性变化形成的能量集中区域,通过分析能量脊的陡峭度变化能实现设备健康预判。但实际检测中面临两大核心难题:一是噪声干扰严重,不同频段能量分布差异极大,滤波处理易丢失细节信息,导致能量脊可见性和清晰度极低;二是传统方法适配性差,能量脊局部呈不连续边缘、全局为连续线结构,传统线检测或边缘检测模型难以兼顾全局关联与局部细节,无法有效提取完整脊线。
例如提升机匀速运行阶段的频谱图显示,低频与高频段能量分布悬殊,背景噪声颗粒会降低脊线对比度并破坏其连续性(如图1、图2所示),传统基于梯度或霍夫变换的方法在此类场景下漏检、误检率极高。

图1 提升机运行噪声频谱图

图2 提升机匀速阶段能量分布
核心创新:DeepRidge模型的“多尺度融合+注意力增强”设计
受人类观察模糊图像时“先全局概览再局部确认”的认知逻辑启发,研究团队基于SegNet语义分割网络,设计了端到端的DeepRidge模型,通过多编码器-注意力模块-解码器块提取并融合多尺度特征,实现能量脊的精准检测。模型核心架构如图3所示。

图3 五层DeepRidge模型架构图
1. 编码器-解码器注意力连接结构:兼顾特征提取与细节保留
模型以倒置残差结构构建编码器与解码器:编码器通过1×1卷积降维、3×3卷积提取特征、2×2最大池化下采样,同时保存池化索引用于后续上采样;解码器基于编码器保存的索引进行非线性上采样,恢复特征图尺寸后通过卷积层融合特征。关键创新在于引入注意力门模块,将每对编码器与解码器的最后一层卷积特征进行融合,通过生成门控信号调节不同空间位置特征的重要性,选择性提取关键信息并抑制无关背景噪声。
为适配嵌入式部署,模型还做了针对性优化:维度约简卷积采用线性激活函数避免信息丢失,其他卷积层采用ReLU6替代ReLU,限制输出值范围以适配低精度浮点数运算;最大池化层的引入不仅扩大感受野,更实现降维减参,提升模型运行效率。编码器-解码器具体结构如图4所示。

图4 编码器-解码器结构示意图
2. 多尺度特征融合:全局与局部信息的精准协同
模型构建多组编码器-解码器对形成不同尺度的搜索域:小尺度特征图用于能量脊的粗定位,捕捉全局连续特征;大尺度特征图用于细优化,补充局部细节信息。所有尺度的融合特征图经输出模块汇总后,生成最终检测结果。这种多尺度融合策略完美匹配能量脊“局部不连续、全局连续”的结构特性,大幅提升检测鲁棒性。
3. 损失函数设计:适配像素级二分类任务
能量脊检测本质是像素级二分类问题(判断像素是否位于脊线上),模型采用基于二元交叉熵的损失函数,以人工标注的脊线图为真值,通过对数损失衡量预测结果与真值的差异,引导模型学习脊线的像素级特征。
实验验证:精度与轻量化性能双优
1. 实验设计:真实数据集+多维度评价
实验数据来源于淮南矿业集团丁集煤矿主井提升机的噪声采集,经短时傅里叶变换生成纵向分辨率为416的频谱图,分割为416×416的图像块后人工标注真值,最终构建含396个训练样本、180个测试样本的数据集。训练基于PyTorch框架,采用RMSProp优化器,以ODS(最优数据集尺度F值)、OIS(最优图像尺度F值)、AP(平均精度)、计算量(FLOPs)和参数量为核心评价指标,对比SegNet、Attention U-Net、DeepCrack、U-Net等主流模型性能。
2. 核心性能:精度与轻量化优势显著
定量对比结果显示,DeepRidge模型综合性能最优(如表1所示):ODS达0.87,AP达0.82577,虽ODS略低于DeepCrack(0.93),但AP高出14.01个百分点,检测精度更优;同时模型参数量仅11.66百万,计算量105452百万次,较DeepCrack分别降低62.3%和70.8%,轻量化优势突出,为嵌入式部署奠定基础。
| 方法 | OIS | ODS | AP | 计算量/百万次 | 参数量/百万 |
|---|---|---|---|---|---|
| DeepRidge | 0.88 | 0.87 | 0.82577 | 105,452 | 11.66 |
| U-Net | 0.46 | 0.45 | 0.43279 | 81,974 | 13.39 |
| Attention U-Net | 0.44 | 0.42 | 0.65501 | 241,004 | 42.88 |
| SegNet | 0.70 | 0.68 | 0.59462 | 77,027 | 18.81 |
| DeepCrack | 0.91 | 0.93 | 0.68546 | 361,049 | 30.90 |
表1 五种深度学习模型定量评价结果
精度-召回曲线(PR曲线)进一步验证了模型性能,DeepRidge曲线更贴近右上角,表明在不同召回率下均保持高精准度(如图5所示)。可视化结果显示,DeepRidge能有效规避背景噪声干扰,完整提取能量脊线,而对比模型存在不同程度的断裂或误检现象。

图5 测试集上五种模型的PR曲线
3. 模型配置优化:确定最优架构
为找到最优配置,研究团队设计了四种不同结构的DeepRidge模型(表2),通过对比测试发现“标准版”(5组编码器-解码器对)性能最佳:ODS达0.87,AP达0.82577。增加编码器-解码器对(深度版)会因小尺度特征图信息不足降低精度,减少对(浅滩版)则因缺失关键尺度特征导致性能下降,增加卷积层(厚重版)易引发过拟合。
| 模型 | 类型 | 编码器-解码器对数量 |
|---|---|---|
| DeepRidge-Shoal(浅滩版) | 标准版 | 4 |
| DeepRidge-Standard(标准版) | 标准版 | 5 |
| DeepRidge-Heavy(厚重版) | 厚重版 | 5 |
| DeepRidge-Deep(深度版) | 标准版 | 6 |
表2 不同配置的DeepRidge模型参数
4. 嵌入式部署:兼顾精度与速度
为实现提升机旁原位分析,团队在瑞芯微RK3588S嵌入式平台(6TOPS算力NPU)上对模型进行优化,通过张量操作重构不支持的MaxUnpool2d算子,并测试不同量化方式的性能。结果显示(表3),混合量化模型在保持较高精度(ODS=0.851,AP=0.7675)的同时,推理速度达0.85417秒/帧,较浮点32位模型提升30%,完全满足现场实时检测需求。
| 参数 | Float32(浮点32位) | Int8(整型8位) | 混合量化 |
|---|---|---|---|
| OIS | 0.862 | 0.81 | 0.854 |
| ODS | 0.847 | 0.79 | 0.851 |
| AP | 0.8026 | 0.6471 | 0.7675 |
| 单帧耗时/秒 | 1.196743 | 0.776506 | 0.85417 |
表3 DeepRidge在RK3588S平台的量化性能测试
研究意义与未来展望
DeepRidge模型的创新之处在于:通过注意力增强的多尺度特征融合,突破了噪声干扰下能量脊检测的精度瓶颈;同时采用轻量化设计,实现嵌入式平台实时部署,为提升机健康监测提供了“精准检测+原位分析”的一体化解决方案。研究构建的提升机噪声频谱数据集及核心代码已开源至GitHub,为行业研究提供重要支撑。
未来,团队计划将DeepRidge与能量脊陡峭度分析算法结合,建立“脊线提取-特征分析-故障预警”的全流程模型,实现提升机早期故障的精准预判;同时拓展模型在风机、水泵等其他煤矿关键设备故障检测中的应用,推动煤矿智能化监测技术升级。
