DETR是基于Transformer的目标检测框架的新设计,为社区开发完整的端到端检测器提供参考。 但也面临一些挑战,例如:训练时间较长,小目标的性能较差。
Deformable DETR是解决上述问题的一种流行方法,并且大大提高了检测性能。代替通过原始的多头注意力在Transformer中查看图像特征图上的所有空间位置,建议使用可变形注意模块(deformable attention module)来关注参考点周围的一小组关键位置。 这样,大大降低了计算复杂度,也有利于快速收敛。
更重要的是,可变形注意模块可轻松应用于融合多尺度功能。 与DETR相比,可变形DETR的性能更好,训练成本降低了10倍,推理速度提高了1.6倍。deformable DETR还应用了一些其他改进,包括有效的迭代边界框优化方法和two-stage方案,从而进一步提高了性能。
然而,由于知识点比较繁杂,都很难形成一套完整的教程。许多刚入门的同学,只能依靠网上零散的资料学习,很难高效成长进步。
为了让大家对计算机视觉中的这一要领学习的更好,给大家推荐一门【深度学习缺陷检测实战篇目标】,由人工智能实战专家的唐宇迪博士,课程将会从环境配置、基础算法分析、实战讲解三部分展开帮助学习背后根本原理。
联系客服