原文:
多模态学习方法在视频理解中的应用
多模态融合方法在情感识别中的应用研究
昵称26181007 阅9
谷歌Jeff Dean 2022「年终汇报」,大模型、AI 绘画神器交出满意答卷
天承办公室 阅9
从视觉和音频角度看多模态学习的过去与未来
何为何未 阅19
中科院出手!1000亿参数全模态大模型发布,能看懂视频、绘画作曲、分析信号
细雨青衫 阅208 转2
多模态神经机器翻译:融合文本与图像的新方法
昵称26407850 阅11
从视音角度看多模态学习的过去与未来
颐源书屋 阅9
基于知识图谱的语义理解技术及应用
中国陆海天老人 阅583 转6
模式识别学科发展报告丨八、语音语言信息处理未来重要研究问题
GTF_001 阅49 转3
什么是语言与视觉一体的统一模态预训练
趣味资源馆 阅6
如何借助注意力机制改进VQA模型的性能
轻语者 阅11
辞书研究 | 章宜华:论融媒体背景下辞书编纂与出版的创新【转发】
风吟楼 阅354 转3
GPT-4发布,能击败90%的人类
天下知仓 阅12 转3
同时利用字幕、音频、视频进行检索!Inria&谷歌提出MMT用于高效跨模态视频检索,代码已开源!
我爱计算机视觉 阅66
AIGC(生成式AI)的行业发展趋势(二)
mrjiangkai 阅221 转3
今天聊一聊模态嵌入的重要性
月霞柳梢头 阅7
刷新多个SOTA!Meta重磅新作AnyMAL:多模态版Llama2来了!
黄爸爸好 阅26
李飞飞团队最新成果:通过口语和3D面部表情评估抑郁症严重程度
雷锋网 阅393 转5
语音变文本,高效助力!录音免费转文字工具推荐
柒柒A 阅2
音频怎么转换成文字?视频转文字方法
职场百科 阅4
视频配音软件哪个好用?推荐三个好用的办法
昵称26407063 阅4
ppt课件中实现视音频播放的控制
ymmt 阅1119 转237
首页
留言交流
联系我们
回顶部