数码之家

 找回密码
 立即注册

QQ登录

只需一步,快速开始

微信登录

微信扫一扫,快速登录

搜索
查看: 27|回复: 0

[科技] 英伟达开源 Audio2Face:AI 实时生成面部动画,多语言口型同步

[复制链接]
发表于 昨天 19:58 | 显示全部楼层 |阅读模式

爱科技、爱创意、爱折腾、爱极致,我们都是技术控

您需要 登录 才可以下载或查看,没有账号?立即注册 微信登录

x
英伟达昨日(9 月 24 日)发布博文,宣布开源生成式 AI 面部动画模型 Audio2Face,涵盖模型、软件开发工具包(SDK)及完整训练框架,希望能在游戏和 3D 应用中,加速开发 AI 智能虚拟角色。
该技术通过分析音频中的音素、语调等声学特征,实时驱动虚拟角色面部动作,生成精准的口型同步和自然的情感表情,可广泛应用于游戏、影视制作和客户服务等领域。
Audio2Face 支持两种运行模式:预录制音频的离线渲染和动态 AI 角色的实时流式处理。IT之家援引博文介绍,英伟达此次开源了多个核心组件:
  • Audio2Face SDK
  • 适用于 Autodesk Maya 的 2.0 版本本地执行插件
  • Unreal Engine 5.5 及以上版本的 2.5 插件
  • 回归模型(v2.2)
  • 扩散模型(v3.0)
  • 开源训练框架支持开发者使用自有数据微调模型,以适应特定应用场景。
该技术已获行业广泛采用。游戏开发商 Survios 在《异形:侠盗入侵进化版》(Alien: Rogue Incursion Evolved Edition)中集成 Audio2Face,大幅简化了口型同步与面部捕捉流程。
Farm 51 工作室也将其用于《切尔诺贝利人 2:禁区》(Chernobylite 2: Exclusion Zone),通过音频直接生成细腻面部动画,节省大量制作时间,提升角色真实感和沉浸体验。创新总监 Wojciech Pazdur 称此为“革命性突破”。

您需要登录后才可以回帖 登录 | 立即注册 微信登录

本版积分规则

APP|手机版|小黑屋|关于我们|联系我们|法律条款|技术知识分享平台

闽公网安备35020502000485号

闽ICP备2021002735号-2

GMT+8, 2025-9-26 00:11 , Processed in 0.078001 second(s), 6 queries , Gzip On, Redis On.

Powered by Discuz!

© 2006-2025 MyDigit.Net

快速回复 返回顶部 返回列表