|
今年五一假期刚开始,阿里巴巴AI团队就带来新惊喜。4月30日,Qwen团队在Hugging Face平台公开了全新Qwen2.5-Omni-3B模型,这是继3月推出7B版本后再次迭代的轻量级多模态AI工具。
这款仅30亿参数的AI模型虽比旗舰款7B版本精简过半,但能力不打折。官方数据显示其多模态理解能力保留原版90%水准,视频理解测试获68.8分,语音生成评估更是冲到92.1分,实时文本对话和自然语音输出完全不输老大哥。更有意思的是,当处理2.5万字符的长文本时,显存占用从7B版的60.2GB大幅缩减到28.2GB,这意味着常规24GB显卡就能轻松带动,高端笔记本运行也不是问题。
性能提升的秘密藏在两项创新技术里:既能同步分析视频语音的"双工架构",又能精确定位信息位置的TMRoPE算法。配合FlashAttention 2加速技术和BF16精度优化,让这个模型既能快速运算又省电。不过要特别注意,当前版本主要面向研究者开放,企业想用在产品开发需要单独申请授权。官方明确表示,现阶段更推荐用于技术验证和原型测试。
|
本帖子中包含更多资源
您需要 登录 才可以下载或查看,没有账号?立即注册
x
|