原文:
视觉-语言预训练入门指南
万字深度好文!视觉-语言(VL)智能:任务、表征学习和大型模型
taotao_2016 阅35 转2
扔掉目标检测器,实现真正的端到端多模态预训练!阿里提出E2E-VLP(ACL2021)
我爱计算机视觉 阅75
AGI之MFM:《多模态基础模型:从专家到通用助手》翻译与解读之视觉理解、视觉生成
处女座的程序猿 阅151 转2
SimVLM:具有弱监督的简单视觉语言模型预训练
雨夜的博客 阅225 转2
分割一切模型SAM首篇全面综述:28页、200 篇参考文献
天承办公室 阅2
文档图像处理:大模型的突破与新探索
小虚竹 阅47
首页
留言交流
联系我们
回顶部