从视音角度看多模态学习的过去与未来--相关文章

原文：从视音角度看多模态学习的过去与未来

跨模态学习在三维语义分割领域适应中的应用

小白学视觉阅62

NTU、上海AI Lab整理300 论文：基于Transformer的视觉分割最新综述出炉

天承办公室阅10

重磅！百度多模态模型ERNIE-ViL刷新5项任务记录，登顶权威榜单VCR

莫斯科威阅39

AI综述专栏 | 多模态机器学习综述

michael1314520 阅2553 转29

挑战你的“视觉”和“听觉”的音樂播放器！

乘上知识的翅膀阅69 转5

基于知识图谱的语义理解技术及应用

中国陆海天老人阅583 转6

多模态学习，带来AI全新应用场景？

视觉推理与场景理解：从感知到高层语义的迁移

办公技巧达人阅7

万字深度好文！视觉-语言（VL）智能：任务、表征学习和大型模型

taotao_2016 阅35 转2

视觉增强词向量：我是词向量，我开眼了！

黄爸爸好阅65 转2

紫东太初：造一个国产大模型，需用多少篇高质量论文？

如何在多模态数据上进行数据增强？亚马逊李沐团队提出简单有效的MixGen，在多个多模态任务上显著提升性能！

我爱计算机视觉阅66

AGI之MFM：《多模态基础模型：从专家到通用助手》翻译与解读之统一的视觉模型、加持LLMs的大型多模态模型

处女座的程序猿阅61

什么是语言与视觉一体的统一模态预训练

趣味资源馆阅6

深度学习模型在计算机视觉中的应用

第七代师兄阅5

“在所有事情上打败所有人”，微软多模态新作横扫12类任务，连纯视觉SOTA都刷新了

金陵一棵树阅10

你知道什么是视觉-文本跨模态任务吗

办公达人分享阅7

从原始传感器输入中联合提取视觉目标与语言词汇有什么作用

昵称26407850 阅2

【智能座舱】智能座舱中多模态交互设计

yeshuheng 阅48 转2

MIT黑科技：无需视觉输入，立体声音频摄像机元数据即可实现移动车辆定位

西北望msm66g9f 阅46

今天来聊一聊图像上的多层次分类器设计

坚定不移2 阅26

SLAMANTIC - 利用语义信息来改进在动态环境中的视觉定位与地图构建

［首藏作品］（8830）AI从“一专一能”迈向“多专多能”

我爱创造阅11 转8