数码之家

 找回密码
 立即注册
搜索
查看: 37|回复: 0

[业界] 英伟达推出代码推理王炸!开源OCR模型三连发干翻OpenAI

[复制链接]
发表于 昨天 21:36 | 显示全部楼层 |阅读模式
老黄家这次真下血本了!英伟达这两天在Hugging Face甩出三款开源的代码推理AI模型,320亿参数的OpenCodeReasoning-32B、140亿的14B和70亿的7B全数开放下载,用的还是程序员最爱的Apache 2.0协议。这三个宝贝用的都是自家Nemotron架构,专门针对多国语言和复杂任务调教过的Transformer技术。

32B版本就是给土豪实验室准备的怪兽级模型,跑代码推理跟喝水似的顺畅;14B版在速度和性能间找到甜蜜点;7B版更绝,塞进笔记本都能跑,关键测试还能跟大佬们掰手腕。最良心的是32B还带了指令微调版,直接适配llama.cpp、vLLM这些市面主流框架,开发者们拿回去插上电就能用。

实战数据才叫劲爆!在模拟真实编程环境的LiveCodeBench测试里,OCR套装把OpenAI的o3-Mini和o1按在地上摩擦。32B版本拿下61.8分碾压全场,连自家70亿参数的小弟OCR-Qwen-7B都能砍下48.5分,比同级别选手高出一大截。

秘密武器是英伟达特制的OCR数据集,里面全是高质量代码资料,专门训练AI理解复杂指令、拆解多步问题。现在搞算法开发的哥们算是捡到宝了,这三个开源模型妥妥的编程加速器,GitHub评论区已经开始狂欢模式。

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有账号?立即注册

x
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

APP|手机版|小黑屋|关于我们|联系我们|法律条款|技术知识分享平台

闽公网安备35020502000485号

闽ICP备2021002735号-2

GMT+8, 2025-5-10 17:14 , Processed in 0.405600 second(s), 11 queries , Redis On.

Powered by Discuz!

© 2006-2025 MyDigit.Net

快速回复 返回顶部 返回列表