训练加快10倍！基于Transformer的目标检测方法

DETR是基于Transformer的目标检测框架的新设计，为社区开发完整的端到端检测器提供参考。但也面临一些挑战，例如：训练时间较长，小目标的性能较差。

Deformable DETR是解决上述问题的一种流行方法，并且大大提高了检测性能。代替通过原始的多头注意力在Transformer中查看图像特征图上的所有空间位置，建议使用可变形注意模块（deformable attention module）来关注参考点周围的一小组关键位置。这样，大大降低了计算复杂度，也有利于快速收敛。

更重要的是，可变形注意模块可轻松应用于融合多尺度功能。与DETR相比，可变形DETR的性能更好，训练成本降低了10倍，推理速度提高了1.6倍。deformable DETR还应用了一些其他改进，包括有效的迭代边界框优化方法和two-stage方案，从而进一步提高了性能。

然而，由于知识点比较繁杂，都很难形成一套完整的教程。许多刚入门的同学，只能依靠网上零散的资料学习，很难高效成长进步。

为了让大家对计算机视觉中的这一要领学习的更好，给大家推荐一门【深度学习缺陷检测实战篇目标】，由人工智能实战专家的唐宇迪博士，课程将会从环境配置、基础算法分析、实战讲解三部分展开帮助学习背后根本原理。

以下是本次课程的内容节选，唐老师将会分享从基础神经网络开始，逐步过渡DETR的整个发展历程。掌握底层逻辑，你才能更好的构建上层建筑。

本站仅提供存储服务，所有内容均由用户发布，如发现有害或侵权内容，请点击举报。