数码之家

 找回密码
 立即注册

QQ登录

只需一步,快速开始

微信登录

微信扫一扫,快速登录

搜索
查看: 155|回复: 0

[业界] Meta开放Llama API:推理速度超ChatGPT 20倍

[复制链接]
发表于 2025-4-30 22:17:30 | 显示全部楼层 |阅读模式
在最近的LlamaCon开发者大会上,Meta公司掏出三张王炸——免费开放的Llama API、比ChatGPT快20倍的推理速度,还有无缝对接OpenAI生态的绝活。开发者现在能直接调用Llama 4 Scout和Maverick两大新模型,用Type或Python写两行代码就能跑起来,跟玩沙盒游戏似的简单。

速度才是硬道理:Cerebras家的Llama 4模型直接飙到每秒2600个token生成,比老黄家GPU快出十八条街。横向对比更离谱,这速度是ChatGPT的20倍,把DeepSeek按在地上摩擦。Cerebras老板拍胸脯说:「这就是全球最快推理系统,传统GPU根本摸不到车尾灯!」

看价钱也不虚:Groq平台的Llama 4 Scout每百万token输入收费0.11刀,输出0.34刀;高配版Maverick分别是0.5刀和0.77刀。虽然速度只有每秒460token,但相比其他方案还是快四倍。Meta这次还拉通OpenAI生态,开发者用惯的代码能直接平移过来,换模型比换手机壳还方便。

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有账号?立即注册 微信登录

x
您需要登录后才可以回帖 登录 | 立即注册 微信登录

本版积分规则

APP|手机版|小黑屋|关于我们|联系我们|法律条款|技术知识分享平台

闽公网安备35020502000485号

闽ICP备2021002735号-2

GMT+8, 2025-6-18 14:23 , Processed in 0.140401 second(s), 8 queries , Redis On.

Powered by Discuz!

© 2006-2025 MyDigit.Net

快速回复 返回顶部 返回列表