|
当全世界都在担心AI泄露隐私时,最新发布的权威测评却爆出大冷门——中国大模型DeepSeek在数据安全关键项上,居然把美国巨头Meta的Llama3甩开两条街!这场由Tumeryk公司发起的AI信任评分,究竟揭开了哪些行业真相?
最近亮相的AI信任评分体系搞了个大动作,把市面主流AI模型放在显微镜下检测。这套由Tumeryk公司开发的评估系统,专门盯着数据泄露、有害内容、事实准确性等九大安全指标打分,总分1000封顶。企业安全主管们现在有了新工具,AI Trust Manager平台能实时监控模型表现,哪里漏风补哪里。
最让人意外的是评估结果:运行在英伟达平台的中国模型DeepSeek,在防止敏感信息泄露这项拿到910分,直接碾压美国选手。对比Anthropic的Claude Sonnet3.5(687分)和Meta的Llama3.1 405B(557分),中国AI这次在数据安全赛道秀了把肌肉。就连阿里云等国内大厂选手,表现也比外界想象中靠谱。
这套评分系统确实有点东西,九项检测指标把AI模型扒得底朝天:防恶意指令攻击、减少胡言乱语、输出内容过滤、供应链安全、心理健康影响、算法公平性...Tumeryk CEO罗希特·瓦利亚透露,他们的监控平台已经帮不少企业堵住了AI漏洞,特别是金融医疗这些敏感行业。
值得关注的是,DeepSeek虽然技术源自中国,但实际跑在英伟达和SambaNova的美国硬件上,完全符合国际数据安全规范。这种"中国算法+美国硬件"的组合拳,意外成了跨国合规的典型案例。如今AI军备竞赛进入2.0阶段,安全合规正在取代单纯追求参数大小,成为企业选型的黄金标准。
从最新评分趋势看,国产大模型正在撕掉"安全隐患"的标签。当Llama3在有害内容过滤上栽跟头时,DeepSeek用实际表现证明:中国AI不仅能打,还能守得住安全底线。这场评分风波给行业提了个醒——在AI信任这道必答题面前,没有哪个玩家能躺在功劳簿上吃老本。
|
本帖子中包含更多资源
您需要 登录 才可以下载或查看,没有账号?立即注册
x
|