数码之家

 找回密码
 立即注册

QQ登录

只需一步,快速开始

微信登录

微信扫一扫,快速登录

搜索
查看: 37|回复: 4

[科技] 美团发布开源LongCat-Video视频生成模型,可稳定输出5分钟级内容

[复制链接]
发表于 昨天 20:47 | 显示全部楼层 |阅读模式

爱科技、爱创意、爱折腾、爱极致,我们都是技术控

您需要 登录 才可以下载或查看,没有账号?立即注册 微信登录

x
今天上午,美团 LongCat 团队发布并开源 LongCat-Video 视频生成模型。根据官方介绍,其以统一模型在文生、图生视频基础任务上达到开源 SOTA(最先进水平),并依托原生视频续写任务预训练,实现分钟级长视频连贯生成,保障跨帧时序一致性与物理运动合理性,在长视频生成领域具备显著优势。
根据介绍,近年来,“世界模型”(World Model)可让人工智能真正理解、预测甚至重构真实世界,从而被视作通往下一代智能的核心引擎。作为能够建模物理规律、时空演化与场景逻辑的智能系统,“世界模型”赋予人工智能“看见”世界运行本质的能力。而视频生成模型有望成为构建世界模型的关键路径:通过视频生成任务压缩几何、语义、物理等多种形式的知识,人工智能得以在数字空间中模拟、推演乃至预演真实世界的运行。
作为基于 Diffusion Transformer(DiT)架构的多功能统一视频生成基座,LongCat-Video 创新通过“条件帧数量”实现任务区分 —— 文生视频无需条件帧、图生视频输入 1 帧参考图、视频续写依托多帧前序内容,原生支持三大核心任务且无需额外模型适配,形成“文生 / 图生 / 视频续写”完整任务闭环。
  • 文生视频:可生成720p、30fps 高清视频,能精准解析文本中物体、人物、场景、风格等细节指令,语义理解与视觉呈现能力达开源 SOTA 级别。
  • 图生视频:严格保留参考图像的主体属性、背景关系与整体风格,动态过程符合物理规律,支持详细指令、简洁描述、空指令等多类型输入,内容一致性与动态自然度表现优异。
  • 视频续写:视频续写是 LongCat Video 的核心差异化能力,可基于多帧条件帧续接视频内容,为长视频生成提供原生技术支撑。
依托视频续写任务预训练、Block-Causual Attention 机制和 GRPO 后训练,LongCat-Video 可稳定输出 5 分钟级别的长视频,且无质量损失,号称达到行业“顶尖”水平。
IT之家附有关链接如下:

发表于 昨天 21:32 | 显示全部楼层
是不是以后拍电影电视之类的,只需生成就可以了?
回复 支持 反对

使用道具 举报

发表于 昨天 21:33 | 显示全部楼层
fqazwsx12 发表于 2025-10-27 21:32
是不是以后拍电影电视之类的,只需生成就可以了?

给一个故事,就是一部电影,演员不需要了
回复 支持 反对

使用道具 举报

发表于 昨天 21:33 | 显示全部楼层
fqazwsx12 发表于 2025-10-27 21:33
给一个故事,就是一部电影,演员不需要了

包括影视基地、服装道具等等都不需要了
回复 支持 反对

使用道具 举报

发表于 昨天 21:34 | 显示全部楼层
fqazwsx12 发表于 2025-10-27 21:33
包括影视基地、服装道具等等都不需要了

声音什么的,应该也有配套的软件了吧
回复 支持 反对

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册 微信登录

本版积分规则

APP|手机版|小黑屋|关于我们|联系我们|法律条款|技术知识分享平台

闽公网安备35020502000485号

闽ICP备2021002735号-2

GMT+8, 2025-10-28 00:53 , Processed in 0.093600 second(s), 8 queries , Gzip On, Redis On.

Powered by Discuz!

© 2006-2025 MyDigit.Net

快速回复 返回顶部 返回列表