CVPR2021 用更好的目标检测器提取视觉特征！微软提出VinVL，基于更好的视觉特征，达到更强的多模态性能--相关文章

原文：CVPR2021 用更好的目标检测器提取视觉特征！微软提出VinVL，基于更好的视觉特征，达到更强的多模态性能

万字深度好文！视觉-语言（VL）智能：任务、表征学习和大型模型

taotao_2016 阅35 转2

视觉-语言预训练入门指南

520jefferson 阅288 转3

ICLR 2020| VL-BERT：预训练视觉-语言模型

DrugAI 阅109 转2

脑电研究：通过神经活动和视觉特征的多模态学习解码大脑表征

思影科技阅508 转2

CVPR 2020 | 京东AI研究院对视觉与语言的思考：从自洽、交互到共生

天承办公室阅248

你知道什么是空间调制的共同注意力模型吗

昵称26407850 阅7

深度学习模型在计算机视觉中的应用

第七代师兄阅5

基于海量图文数据和多粒度视觉特征的多模态预训练

办公达人分享阅2

视觉问答技术的发展趋势与未来展望

坚定不移2 阅17

扫描文件还不会用百度网盘，鸡哔你！

laoyu2012 阅26

Transformer在计算机视觉领域走到哪了？

黄爸爸好阅27

利用知识蒸馏实现跨模态学习：从图像到语音

办公技巧达人阅23

多模态学习模型在情感分析中的应用

科技分享小助手阅3

AGI之MFM：《多模态基础模型：从专家到通用助手》翻译与解读之视觉理解、视觉生成

处女座的程序猿阅131 转2