数码之家

 找回密码
 立即注册
搜索
查看: 59|回复: 0

[业界] 中国AI弯道超车!DeepSeek信任评分碾压美国Llama3

[复制链接]
发表于 3 天前 | 显示全部楼层 |阅读模式
当全世界都在担心AI泄露隐私时,最新发布的权威测评却爆出大冷门——中国大模型DeepSeek在数据安全关键项上,居然把美国巨头Meta的Llama3甩开两条街!这场由Tumeryk公司发起的AI信任评分,究竟揭开了哪些行业真相?

最近亮相的AI信任评分体系搞了个大动作,把市面主流AI模型放在显微镜下检测。这套由Tumeryk公司开发的评估系统,专门盯着数据泄露、有害内容、事实准确性等九大安全指标打分,总分1000封顶。企业安全主管们现在有了新工具,AI Trust Manager平台能实时监控模型表现,哪里漏风补哪里。

最让人意外的是评估结果:运行在英伟达平台的中国模型DeepSeek,在防止敏感信息泄露这项拿到910分,直接碾压美国选手。对比Anthropic的Claude Sonnet3.5(687分)和Meta的Llama3.1 405B(557分),中国AI这次在数据安全赛道秀了把肌肉。就连阿里云等国内大厂选手,表现也比外界想象中靠谱。

这套评分系统确实有点东西,九项检测指标把AI模型扒得底朝天:防恶意指令攻击、减少胡言乱语、输出内容过滤、供应链安全、心理健康影响、算法公平性...Tumeryk CEO罗希特·瓦利亚透露,他们的监控平台已经帮不少企业堵住了AI漏洞,特别是金融医疗这些敏感行业。

值得关注的是,DeepSeek虽然技术源自中国,但实际跑在英伟达和SambaNova的美国硬件上,完全符合国际数据安全规范。这种"中国算法+美国硬件"的组合拳,意外成了跨国合规的典型案例。如今AI军备竞赛进入2.0阶段,安全合规正在取代单纯追求参数大小,成为企业选型的黄金标准。

从最新评分趋势看,国产大模型正在撕掉"安全隐患"的标签。当Llama3在有害内容过滤上栽跟头时,DeepSeek用实际表现证明:中国AI不仅能打,还能守得住安全底线。这场评分风波给行业提了个醒——在AI信任这道必答题面前,没有哪个玩家能躺在功劳簿上吃老本。

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有账号?立即注册

x
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

APP|手机版|小黑屋|关于我们|联系我们|法律条款|技术知识分享平台

闽公网安备35020502000485号

闽ICP备2021002735号-2

GMT+8, 2025-3-16 01:34 , Processed in 0.124801 second(s), 10 queries , Redis On.

Powered by Discuz!

© 2006-2025 MyDigit.Net

快速回复 返回顶部 返回列表