在工业生产的焊接车间里,焊瘤的存在如同“隐形炸弹”——这些由熔滴过渡不完全形成的金属堆积物,会直接影响工件结构完整性和产品性能。传统人工检测耗时耗力且主观性强,常规检测算法又受限于小目标密集、背景复杂及硬件条件等问题,难以兼顾精度与速度。近日,AIMC LAB研究生周磊提出的改进RTDETR算法(EHF-RTDETR),成功破解这一行业痛点,相关成果已发表于《激光杂志》。
行业痛点:焊瘤检测的“三重困境”
焊瘤检测看似简单,实则面临多重挑战:
一是目标特性刁钻,焊瘤尺寸小、分布密集,还常被熔渣等杂质干扰;
二是环境复杂多变,车间光照、拍摄角度差异大,背景噪声多;
三是硬件约束严格,工业现场部署的设备往往算力有限,无法支撑大型模型运行。
此前主流方案各有短板:YOLO系列虽快但全局信息捕捉不足,传统Transformer模型精度高却体积庞大。而百度提出的RTDETR虽实现实时检测,在小目标检测和轻量化部署上仍有提升空间——这正是我们研究的突破口。
核心创新:EHF-RTDETR的“三板斧”改进
我们以RTDETR-R18为基础,从主干网络、特征融合、损失函数三大维度进行优化,打造出轻量化高精度的EHF-RTDETR模型。先来看原模型与改进模型的结构对比:

图1 RTDETR-R18原模型结构

图2 EHF-RTDETR改进模型结构
1. 主干网络:轻量化与多尺度的“双向奔赴”
针对原模型计算冗余问题,我们设计了Rep-FasterNet EMA Block:一方面采用FasterNet的部分卷积(Pconv)替代传统卷积,仅对部分通道处理,大幅降低计算量;另一方面引入RepConv结构提升模型精度,再结合EMA多尺度注意力机制,强化对小目标特征的捕捉能力。
这种设计让模型在“瘦身”的同时更“敏锐”——通过跨空间信息聚合,精准锁定密集分布的小焊瘤,解决了传统模型对尺度变化适应性差的问题。
2. 编码器:HS-FPN破解特征融合“痛点”
传统FPN/PAN特征融合存在语义与定位信息失衡、计算复杂等问题。我们引入HS-FPN(高级筛选功能金字塔网络),通过两大核心模块优化:
- 特征选择模块:结合通道注意力和维度匹配,为不同通道分配权重,筛选关键特征;
- 选择性特征融合(SFF)模块:以高级特征为权重,策略性融合低级特征,既保留定位细节又强化语义信息,还能精简冗余参数。

图3 HS-FPN模块结构示意图
3. 损失函数:Focal-SIOU让回归更“精准高效”
原模型的GIoU损失在小目标检测时,易因边界框微小误差导致梯度不足。我们将Focal机制与SIOU结合,提出Focal-SIOU损失函数:
- SIOU引入角度、距离、形状三重成本函数,精准衡量边界框差异;
- Focal机制通过平衡系数调节样本权重,让模型聚焦于难检测的小目标。
这一改进不仅提升了小目标检测精度,还让模型收敛速度更快,训练效率大幅提升。
实验验证:数据见证实力
为验证改进效果,我们构建了包含1800张焊瘤图像的数据集(经翻转、亮度调整等数据增强处理),在Intel i5-12400F + RTX 2060 SUPER平台上开展实验。
1. 核心性能:精度与速度“双提升”
消融实验显示,综合三大改进的EHF-RTDETR模型表现最优:
| 模型 | mAP0.5(%) | mAP0.5-0.9(%) | 模型体积(MB) | FPS(帧/秒) |
|---|---|---|---|---|
| 原RTDETR-R18 | 71.8 | 47.5 | 38.5 | 56.9 |
| EHF-RTDETR | 76.7 | 51.9 | 33.1 | 63.5 |
关键指标实现全面突破:mAP0.5提升4.9个百分点,模型体积缩减14.0%,检测速度提升11.6%,完美适配工业端算力受限场景。
2. 对比实验:优于主流算法
与Yolov5、Yolov8、Yolov9等主流模型对比,EHF-RTDETR在“体积最小、帧率最高”的前提下,保持了极高的检测精度。例如,相较于Yolov5m,模型体积降低52.6%,帧率提升5.2%,mAP0.5高出26.4个百分点。
3. 可视化:小目标检测能力显著增强
通过Grad-CAM热力图可见,改进模型能更精准聚焦焊瘤区域,尤其是原模型漏检的小目标:

图4 原模型与改进模型热力图对比
训练收敛速度也大幅提升——改进模型在125轮即收敛,原模型则需150轮左右,进一步验证了算法的高效性。
未来展望:从检测到“闭环处理”
EHF-RTDETR的提出,为工业焊瘤检测提供了轻量化、高精度的新方案。未来,我们计划将该模型与双目定位算法结合,获取焊瘤的三维位置信息,为后续自动化打磨、切割等处理环节提供数据支撑,构建“检测-定位-处理”的全流程解决方案。
这项成果离不开团队的潜心钻研,也为实验室在工业缺陷检测领域的研究奠定了坚实基础。如果您有相关技术交流需求,欢迎在评论区留言!
