数码之家

 找回密码
 立即注册

QQ登录

只需一步,快速开始

微信登录

微信扫一扫,快速登录

搜索
查看: 859|回复: 20

[科技] 12G显卡就能跑!IBM新AI模型太能扛:5个128K长对话同时聊 RTX3060直接起飞

[复制链接]
发表于 2025-5-10 21:55:13 | 显示全部楼层 |阅读模式
就在上周五(今年5月2日),科技界老牌劲旅IBM冷不丁甩出个重磅消息——他们最新研发的Granite 4.0系列模型中,那个号称"小钢炮"的Granite 4.0 Tiny预览版已经上线。这玩意儿到底有多猛?说出来你可能不信,用张市价329美元的RTX 3060 12G显卡,就能同时开着5个128KB超长对话窗口,全程稳得一批。

这个预览版现在还是个"半成品",但表现已经让人惊掉下巴。虽然完整版计划要"啃"15万亿个训练数据,目前只吃了2.5万亿的"开胃菜",但实测性能直接看齐自家12万亿训练的Granite 3.3 2B版本。更夸张的是,在处理16个并发对话时,内存需求直接砍掉72%!据IBM官方透露,等它完成全套训练后,战斗力完全能和自家8B参数的Granite 3.3掰手腕。

为啥这小身板能这么能打?秘密全藏在它的混血架构里。Granite 4.0 Tiny把Mamba-2和Transformer这两大当红炸子鸡揉在一起,既保留了Transformer的精准度,又继承了Mamba的速度优势,7B参数里实际干活的主力军只有1B。这配置简直就是AI界的"省油小钢炮",性能不缩水还特省电。

要说最离谱的还是它的硬件适配性。目前市面上的中端显卡就能扛住128KB的超长文本对话,这意味着普通开发者用家用电脑就能跑AI大模型。对比那些动不动就要专业级显卡的同行,IBM这次算是把门槛彻底踩到地底了。

现在这个"青春版"已经在Hugging Face开源社区上线,随便下随便用。官方预告今年夏天会放出正式版的Tiny、Small和Medium三档配置。照这趋势发展下去,AI大模型跑进千家万户的日子怕是真的要来了。



本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有账号?立即注册 微信登录

x
发表于 2025-5-10 22:22:45 | 显示全部楼层

回帖奖励 +3 家元

AI大模型跑进千家万户的日子怕是真的要来了。
回复 支持 反对

使用道具 举报

发表于 2025-5-10 22:44:01 | 显示全部楼层

回帖奖励 +3 家元

12G显卡就能跑
回复 支持 反对

使用道具 举报

发表于 2025-5-10 23:12:18 | 显示全部楼层

回帖奖励 +3 家元

12G显卡就能跑!IBM新AI模型太能扛:5个128K长对话同时聊 RTX3060直接起飞
回复 支持 反对

使用道具 举报

发表于 2025-5-11 00:19:21 | 显示全部楼层

回帖奖励 +3 家元

ai不吃显存是个梦
回复 支持 反对

使用道具 举报

发表于 2025-5-11 00:44:54 | 显示全部楼层

回帖奖励 +3 家元

显卡贵啊,反正总感觉就是一个字,贵!
回复 支持 反对

使用道具 举报

发表于 2025-5-11 02:02:31 | 显示全部楼层

回帖奖励 +3 家元

辛苦发贴了
回复 支持 反对

使用道具 举报

发表于 2025-5-11 08:20:44 | 显示全部楼层

回帖奖励 +3 家元

12G显卡就能跑!IBM新AI模型太能扛:5个128K长对话同时聊 RTX3060直接起飞
回复 支持 反对

使用道具 举报

发表于 2025-5-11 08:37:53 | 显示全部楼层

回帖奖励 +3 家元

12G显卡就能跑!IBM新AI模型太能扛:5个128K长对话同时聊 RTX3060直接起飞
回复 支持 反对

使用道具 举报

发表于 2025-5-11 08:51:16 | 显示全部楼层

回帖奖励 +3 家元

12G显卡就能跑
回复 支持 反对

使用道具 举报

发表于 2025-5-11 08:52:05 | 显示全部楼层

回帖奖励 +3 家元

越来越多的AI开发 相信会越来越好
回复 支持 反对

使用道具 举报

发表于 2025-5-11 08:53:16 | 显示全部楼层

回帖奖励 +3 家元

5个128K长对话同时聊 RTX3060直接起飞
回复 支持 反对

使用道具 举报

发表于 2025-5-11 09:58:05 | 显示全部楼层

回帖奖励 +3 家元

12G显卡就能跑!IBM新AI模型太能扛:5个128K长对话同时聊 RTX3060直接起飞 。
回复 支持 反对

使用道具 举报

发表于 2025-5-11 10:06:50 | 显示全部楼层

回帖奖励 +3 家元

IBM新AI模型太能扛?希望都扛起来!
回复 支持 反对

使用道具 举报

发表于 2025-5-11 11:40:33 | 显示全部楼层

回帖奖励 +3 家元

牛逼先吹起来,不然过期了。
回复 支持 反对

使用道具 举报

发表于 2025-5-11 13:52:43 | 显示全部楼层

回帖奖励 +3 家元

可以开展老人陪聊业务了
回复 支持 反对

使用道具 举报

发表于 2025-5-11 14:19:09 | 显示全部楼层

回帖奖励 +3 家元

12G显卡就能跑!IBM新AI模型太能扛:5个128K长对话同时聊 RTX3060直接起飞
回复 支持 反对

使用道具 举报

发表于 2025-5-11 14:40:57 | 显示全部楼层

回帖奖励 +3 家元

科技界老牌劲旅IBM冷不丁甩出个重磅消息——他们最新研发的Granite 4.0系列模型中,
回复 支持 反对

使用道具 举报

发表于 2025-5-11 15:03:38 | 显示全部楼层

回帖奖励 +3 家元

IBM冷不丁甩出个重磅消息——他们最新研发的Granite 4.0系列模型中,那个号称"小钢炮"的Granite 4.0 Tiny预览版已经上线。这玩意儿到底有多猛?说出来你可能不信,用张市价329美元的RTX 3060 12G显卡,就能同时开着5个128KB超长对话窗口,全程稳得一批。
回复 支持 反对

使用道具 举报

发表于 2025-5-11 16:11:22 | 显示全部楼层

回帖奖励 +3 家元

12G显卡就能跑!IBM新AI模型太能扛
回复 支持 反对

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册 微信登录

本版积分规则

APP|手机版|小黑屋|关于我们|联系我们|法律条款|技术知识分享平台

闽公网安备35020502000485号

闽ICP备2021002735号-2

GMT+8, 2025-9-14 12:54 , Processed in 0.187200 second(s), 11 queries , Gzip On, Redis On.

Powered by Discuz!

© 2006-2025 MyDigit.Net

快速回复 返回顶部 返回列表