目标检测DETR升级版横空出世!超越YOLO系列,高区Accept拿到手软~
仅用于站内搜索,没有排版格式,具体信息请跳转上方微信公众号内链接
前段时间北大号称终结YOLO的RT-DETR大家关注了没?还有它超越YOLOv10的进阶版RT-DETRv3…百度&北航&中科院也爆成果了,提出LW-DETR,性能优于YOLO系列…最近有关DETR改进的研究简直太热闹。
众所周知,DETR是一种创新的目标检测框架,在学术研究和特定高精度需求的应用中一直表现出色。一方面,DETR基于Transformer的架构,简化了传统OD方法中的复杂步骤,提高检测精度的同时也提升了模型的灵活性和泛化能力。
另一方面,DETR讲故事的能力更突出,对于论文er来说,目标检测领域如果想发三区及以上,还是选择改DETR更适合。比如百度就有一篇CVPR2024,提出的KD-DETRmAP提升近一半,Neurips上我也发现不少…
本文挑选了12篇DETR最新改进成果分享,全部都有代码,方便各位有论文需求的同学作参考,整理不易,点个赞支持一下~
扫码添加小享,回复“DETR改进”
免费获取全部论文+开源代码
方法:论文介绍了一种名为RT-DETR的新型实时目标检测器。这个模型是首个据作者所知的实时端到端(end-to-end)目标检测器,它在速度和准确性上都超越了现有的实时目标检测器,包括YOLO系列。
创新点:
RT-DETR引入了高效的混合编码器,用于快速处理多尺度特征,从而显著提高推理速度。
RT-DETR提出了不确定性最小查询选择方案,通过明确优化不确定性,为解码器提供高质量的初始查询,从而提高准确性。
方法:论文介绍了一种轻量级的检测Transformer,LW-DETR。通过多层特征聚合和高效的训练、推理技术,在COCO等基准数据集上实现了比现有实时检测器(如YOLO系列)更优的性能和更低的延迟。
创新点:
轻量级架构:结合ViT编码器和DETR解码器,简化实时检测模型。
特征聚合与注意力优化:聚合多级特征图,优化注意力机制,降低计算复杂度。
预训练和监督策略:大规模预训练和改进的监督策略提升性能和训练效率。
扫码添加小享,回复“DETR改进”
免费获取全部论文+开源代码
方法:论文研究了DETR模型的压缩,通过知识蒸馏提出了首个适用于同构和异构蒸馏的通用框架KD-DETR,分析了DETR蒸馏中的关键点,并通过一系列实验验证了KD-DETR在增强学生模型性能方面的灵活性、通用性及可扩展性。
创新点:
首次提出了用于DETR的通用知识蒸馏范式(KD-DETR),这是第一个适用于同构和异构蒸馏的通用知识蒸馏框架。
引入了一种综合的“从一般到特定”的蒸馏点采样方案,包括通用采样、特定采样和前景重平衡权重。
提出了多尺度DETR的学生嵌入初始化继承策略,作为KD-DETR的一部分。
方法:论文提出了一种DETR改进模型DQ-DETR,通过一个分类计数模块动态调整解码器阶段使用的查询数量,并利用计数引导的特征增强模块来提升微小物体的空间信息,从而改善查询的位置信息,使模型能够更精确地定位小物体。
创新点:
DQ-DETR通过分类计数模块动态调整用于检测的对象查询数量,以适应不同图像中实例数量的不平衡。
预测和密度图来估计图像中的实例数量,并将数量分为几个等级,从而动态调整对象查询的数量。
利用分类计数模块生成的密度图与视觉特征相结合,增强了微小物体的空间信息。
扫码添加小享,回复“DETR改进”
免费获取全部论文+开源代码