视觉-语言预训练入门指南--相关文章

原文：视觉-语言预训练入门指南

万字深度好文！视觉-语言（VL）智能：任务、表征学习和大型模型

taotao_2016 阅35 转2

扔掉目标检测器，实现真正的端到端多模态预训练！阿里提出E2E-VLP（ACL2021）

我爱计算机视觉阅75

AGI之MFM：《多模态基础模型：从专家到通用助手》翻译与解读之视觉理解、视觉生成

处女座的程序猿阅151 转2

SimVLM：具有弱监督的简单视觉语言模型预训练

雨夜的博客阅225 转2

分割一切模型SAM首篇全面综述：28页、200 篇参考文献

天承办公室阅2

文档图像处理：大模型的突破与新探索