英伟达推出代码推理王炸！开源OCR模型三连发干翻OpenAI

Meise · 发表于昨天 21:36

老黄家这次真下血本了！英伟达这两天在Hugging Face甩出三款开源的代码推理AI模型，320亿参数的OpenCodeReasoning-32B、140亿的14B和70亿的7B全数开放下载，用的还是程序员最爱的Apache 2.0协议。这三个宝贝用的都是自家Nemotron架构，专门针对多国语言和复杂任务调教过的Transformer技术。

32B版本就是给土豪实验室准备的怪兽级模型，跑代码推理跟喝水似的顺畅；14B版在速度和性能间找到甜蜜点；7B版更绝，塞进笔记本都能跑，关键测试还能跟大佬们掰手腕。最良心的是32B还带了指令微调版，直接适配llama.cpp、vLLM这些市面主流框架，开发者们拿回去插上电就能用。

实战数据才叫劲爆！在模拟真实编程环境的LiveCodeBench测试里，OCR套装把OpenAI的o3-Mini和o1按在地上摩擦。32B版本拿下61.8分碾压全场，连自家70亿参数的小弟OCR-Qwen-7B都能砍下48.5分，比同级别选手高出一大截。

秘密武器是英伟达特制的OCR数据集，里面全是高质量代码资料，专门训练AI理解复杂指令、拆解多步问题。现在搞算法开发的哥们算是捡到宝了，这三个开源模型妥妥的编程加速器，GitHub评论区已经开始狂欢模式。

账号		自动登录	找回密码
密码			立即注册

[业界] 英伟达推出代码推理王炸！开源OCR模型三连发干翻OpenAI

本帖子中包含更多资源

相关帖子