打开APP
userphoto
未登录

开通VIP,畅享免费电子书等14项超值服

开通VIP
3DiFACE: 语音驱动3D数字人脸部嘴形动画

3DiFACE是一种新颖的基于扩散的语音驱动 3D 面部动画方法。给定一个音频,可以生成具有口型同步和随机性的运动序列。此外,3DiFACE 可用于音频一致的动作编辑。

虽然现有方法确定性地从语音预测面部动画,但它们忽略了语音和面部表情之间固有的一对多关系,即存在多个与音频输入匹配的合理面部表情动画。在内容创建中,能够修改生成的运动或指定关键帧尤其重要。
为了实现随机性和运动编辑,作者提出了一种用于 3D 面部运动的轻量级音频调节扩散模型。该扩散模型可以在小型 3D 运动数据集上进行训练,从而保持富有表现力的嘴唇运动输出。此外,它还可以针对特定主题进行微调,只需要该人的短视频即可。

作者用的方法采用Wav2Vec2.0 模型从原始音频信号中提取音频特征。通过一系列卷积块串联,将音频条件注入到网络中。

我觉得这个很有意思。有了这个就能给目前数字人项目丰富更多功能。

地址:

https://balamuruganthambiraja.github.io/3DiFACE/

https://github.com/bala1144/3DiFACE

本站仅提供存储服务,所有内容均由用户发布,如发现有害或侵权内容,请点击举报
打开APP,阅读全文并永久保存 查看更多类似文章
猜你喜欢
类似文章
【热】打开小程序,算一算2024你的财运
顺着网线爬过来成真了,Audio2Photoreal通过对话就能生成逼真表情与动作
音频转文字怎么转换:提高信息获取效率的关键
配音软件有哪些?看完这篇你就知道了
简直太逼真!随便一段语音或文字,就能生成人物说话视频
“克隆”一个你
迪士尼也来研究人工智能,将AI用于动画制作
更多类似文章 >>
生活服务
热点新闻
分享 收藏 导长图 关注 下载文章
绑定账号成功
后续可登录账号畅享VIP特权!
如果VIP功能使用有故障,
可点击这里联系客服!

联系客服