生数科技发布高可控视频大模型Vidu Q1：可精准调整所有动作行为

数码芝华士 · 发表于 2025-3-29 23:01:55

爱科技、爱创意、爱折腾、爱极致，我们都是技术控

您需要登录才可以下载或查看，没有账号？立即注册

x

清华大学人工智能研究院副院长、生数科技创始人兼首席科学家朱军今日发布了高可控视频大模型 Vidu Q1，官方宣称其为业内首个高可控 AI 视频大模型。

IT之家从官方获悉，Vidu Q1 在多主体细节可控（特别是动作、布局可控）、音效同步可控、画质增强等方面均取得显著成效。以多主体细节可控为例，在语义指令的基础上，通过融入参考图的视觉指令，Vidu Q1 支持对场景中多主体的位置、大小、运动轨迹等属性进行更进一步的可控，对所有动作行为（出场、退场、坐立姿态、行动路线）进行精准调整。

其支持音效同步可控功能，可确保随着视频环境与画面转场，Vidu Q1 能够输出生成相应音效，并可精准控制每段音效的长短区间，精准设置每段音频出现的时间点，如 0-2s 风声、3-5s 雨声等。

账号		自动登录	找回密码
密码			立即注册

[业界] 生数科技发布高可控视频大模型Vidu Q1：可精准调整所有动作行为

爱科技、爱创意、爱折腾、爱极致，我们都是技术控

相关帖子

浏览过的版块