Meta开放Llama API：推理速度超ChatGPT 20倍

Meise · 发表于 2025-4-30 22:17:30

在最近的LlamaCon开发者大会上，Meta公司掏出三张王炸——免费开放的Llama API、比ChatGPT快20倍的推理速度，还有无缝对接OpenAI生态的绝活。开发者现在能直接调用Llama 4 Scout和Maverick两大新模型，用Type或Python写两行代码就能跑起来，跟玩沙盒游戏似的简单。

速度才是硬道理：Cerebras家的Llama 4模型直接飙到每秒2600个token生成，比老黄家GPU快出十八条街。横向对比更离谱，这速度是ChatGPT的20倍，把DeepSeek按在地上摩擦。Cerebras老板拍胸脯说：「这就是全球最快推理系统，传统GPU根本摸不到车尾灯！」

看价钱也不虚：Groq平台的Llama 4 Scout每百万token输入收费0.11刀，输出0.34刀；高配版Maverick分别是0.5刀和0.77刀。虽然速度只有每秒460token，但相比其他方案还是快四倍。Meta这次还拉通OpenAI生态，开发者用惯的代码能直接平移过来，换模型比换手机壳还方便。

账号		自动登录	找回密码
密码			立即注册

[业界] Meta开放Llama API：推理速度超ChatGPT 20倍

本帖子中包含更多资源

浏览过的版块