原文:
CVPR2021 用更好的目标检测器提取视觉特征!微软提出VinVL,基于更好的视觉特征,达到更强的多模态性能
万字深度好文!视觉-语言(VL)智能:任务、表征学习和大型模型
taotao_2016 阅35 转2
视觉-语言预训练入门指南
520jefferson 阅288 转3
ICLR 2020| VL-BERT:预训练视觉-语言模型
DrugAI 阅109 转2
脑电研究:通过神经活动和视觉特征的多模态学习解码大脑表征
思影科技 阅508 转2
CVPR 2020 | 京东AI研究院对视觉与语言的思考:从自洽、交互到共生
天承办公室 阅248
你知道什么是空间调制的共同注意力模型吗
昵称26407850 阅7
深度学习模型在计算机视觉中的应用
第七代师兄 阅5
基于海量图文数据和多粒度视觉特征的多模态预训练
办公达人分享 阅2
视觉问答技术的发展趋势与未来展望
坚定不移2 阅17
扫描文件还不会用百度网盘,鸡哔你!
laoyu2012 阅26
Transformer在计算机视觉领域走到哪了?
黄爸爸好 阅27
利用知识蒸馏实现跨模态学习:从图像到语音
办公技巧达人 阅23
多模态学习模型在情感分析中的应用
科技分享小助手 阅3
AGI之MFM:《多模态基础模型:从专家到通用助手》翻译与解读之视觉理解、视觉生成
处女座的程序猿 阅131 转2
首页
留言交流
联系我们
回顶部