数码之家

 找回密码
 立即注册

QQ登录

只需一步,快速开始

微信登录

微信扫一扫,快速登录

搜索
查看: 197|回复: 0

[业界] 智源研究院发布全球首个原生多模态世界模型“悟界・Emu3”

[复制链接]
发表于 2025-6-6 20:13:45 | 显示全部楼层 |阅读模式

爱科技、爱创意、爱折腾、爱极致,我们都是技术控

您需要 登录 才可以下载或查看,没有账号?立即注册 微信登录

x
IT之家 6 月 6 日消息,北京智源人工智能研究院今日发布“悟界”系列大模型,包括全球首个原生多模态世界模型“悟界・Emu3”、全球首个脑科学多模态通用基础模型“悟界・见微 Brainμ”。
智源研究院还发布了悟界・具身智能大模型,包括全球首个支持 MCP 的跨本体大小脑协作框架悟界・RoboOS 2.0、具身大脑大模型悟界・RoboBrain 2.0 和全原子微观生命模型悟界・OpenComplex2 也一并发布。
去年 10 月,智源研究院发布了原生多模态世界模型 Emu3。据IT之家此前报道,该模型只基于下一个 token 预测,无需扩散模型或组合方法,即可完成文本、图像、视频三种模态数据的理解和生成。官方宣称实现图像、文本、视频大一统。Emu3 支持多模态输入、多模态输出的端到端映射,验证了自回归框架在多模态领域的普适性与先进性,为跨模态交互提供了强大的技术基座。
见微 Brainμ 基于 Emu3 底层架构,将 fMRI、EEG、双光子等神经科学与脑医学相关的脑信号统一 token 化,利用预训练模型多模态对齐的优势,可以实现多模态脑信号与文本、图像等模态的多向映射,并实现跨任务、跨模态、跨个体的统一通用建模,以单一模型完成多种神经科学的下游任务。
▲ Emu3 生成的图像

您需要登录后才可以回帖 登录 | 立即注册 微信登录

本版积分规则

APP|手机版|小黑屋|关于我们|联系我们|法律条款|技术知识分享平台

闽公网安备35020502000485号

闽ICP备2021002735号-2

GMT+8, 2025-7-24 23:28 , Processed in 0.171600 second(s), 9 queries , Redis On.

Powered by Discuz!

© 2006-2025 MyDigit.Net

快速回复 返回顶部 返回列表