|
近日,IBM云服务宣布将英特尔Gaudi3 AI加速器纳入全球数据中心,成为首个部署该硬件的云服务商。目前在法兰克福、华盛顿、达拉斯三个区域已开放商用,企业用户可通过虚拟私有云调用算力资源。双方合作瞄准生成式AI应用痛点——研究机构Gartner预测今年全球生成式AI支出将达6440亿美元,同比去年暴增76.4%。
这套新方案的实际价值,用一组对比数据更直观:基于Meta Llama-3.1-405B大模型测试,Gaudi3的单位成本效能高出竞品92%;处理IBM Granite-3.1-8B模型时,小规模负载吞吐量高43%,大上下文场景高36%。英特尔数据中心AI战略副总裁Saurabh Kulkarni表示:"通过云服务释放Gaudi3的推理调优性能,将帮助更多企业降低AI创新门槛。"
在具体应用场景中,这套组合拳正重塑行业格局:
金融服务:银行用其搭建反欺诈系统,实时扫描百万级交易数据
医疗健康:药企借助加速器将药物研发周期压缩30%,同时支撑AI影像诊断
智慧零售:电商平台实现毫秒级库存预测,动态优化仓储物流
技术架构方面,Gaudi3支持多模态大语言模型和增强检索生成(RAG),本季度将实现与红帽OpenShift、IBM watsonx平台的深度集成。IBM云基础设施总经理Satinder Sethi透露:"预计2025年下半年推出跨架构部署方案,届时客户可在混合云环境中灵活调度算力。"
当前登陆IBM云控制台,用户可创建搭载Gaudi3的虚拟服务器实例。对算力需求波动的企业,还能通过动态资源分配实现"用多少付多少"的计费模式。本文消息源引自IBM与英特尔官方声明。
|
本帖子中包含更多资源
您需要 登录 才可以下载或查看,没有账号?立即注册
x
|