数码之家

 找回密码
 立即注册

QQ登录

只需一步,快速开始

微信登录

微信扫一扫,快速登录

搜索
查看: 750|回复: 0

[业界] 华为推AI训练集群Atlas 900 比世界纪录快10秒

[复制链接]
发表于 2019-9-18 14:08:27 | 显示全部楼层 |阅读模式

爱科技、爱创意、爱折腾、爱极致,我们都是技术控

您需要 登录 才可以下载或查看,没有账号?立即注册 微信登录

x










北京时间9月18日消息,在第四届华为全联接大会上,华为在首次发布计算战略,基于架构创新、投资全场景处理器族、有所为有所不为的商业策略、构建开放生态进行布局。同时,华为还发布了“全球最快AI训练集群”Atlas 900,在ResNet-50模型训练中,Atlas 900仅用59.8秒就完成了训练,比原来的世界纪录快了10秒。


华为副董事长胡厚崑

两年前,华为发布了新的愿景使命,就是要“把数字世界带入每个人、每个家庭、每个组织,构建万物互联的智能世界”。华为副董事长胡厚崑认为,智能世界有三个特征,就是万物感知、万物互联、万物智能,要支撑这样一个智能世界,有两个关键的技术需要持续创新和投资:联接和计算,“事实上,联接和计算这两大技术,就象一对孪生兄弟,相互促进、协同发展。可以说,在未来的智能世界里,联接到哪里,计算就到哪里,哪里有计算,哪里就有联接。

过去十年, 华为一直在致力于对于计算产业的投资,并在这一进程中发现了计算进入智能时代的三个重要特征:需要超强的算力,统计计算本身就是一种暴力计算,高度依赖于算力;计算和智能将会无处不在,而不仅仅是分布在中心侧,从中心节点的暴力计算,到边缘侧的专业计算;端边云之间需要高效的协同,中心侧负责通用模型的计算,为端侧的个性化计算和边缘侧的专业化计算,提供协同支撑。

根据Gartner给出的数据,预计到2023年计算产业的规模将超过2万亿美元。为此,华为将从四个方面展开布局:

架构创新,用新的处理器架构来匹配算力的增速,同时适用华为自身覆盖端、边、云的全场景业务智能化需求,达芬奇架构的任务就是要实现计算和智能的无处不在。

投资全场景处理器族,包括支持通用计算的鲲鹏系列、支持AI的昇腾系列、支持智能终端的麒麟系列,以及支持智慧屏的鸿鹄系列,并将推出更多的处理器支持多样场景。

商业策略,不直接对外销售处理器,以云服务面向客户,以部件为主面向合作伙伴,优先支持合作伙伴发展整机,推动硬件开放(把服务器主板、AI模组和板卡等硬件开放给伙伴)、软件开源(把服务器操作系统、数据库、AI开发框架等软件开源,帮助伙伴做好商用版本)、使能应用开发和迁移(提供工具和团队,帮助伙伴更高效地做好应用开发和迁移)。

构建开放生态,沃土计划在过去四年已发展130多万开发者和14000多家ISV,今天该计划迎来了升级,华为将继续投入15亿美元,使开发者的规模扩大到500万人,使能全球合作伙伴发展应用及解决方案。

在本次华为全联接大会上,华为还重磅发布了搭载数千颗昇腾处理器的“全球最快AI训练集群”——Atlas 900。Atlas 900由数千颗昇腾910 AI处理器互联构成,总算力达到256P~1024P FLOPS @FP16,相当于50万台PC的计算能力。昇腾910 AI处理器采用SoC设计,集成“AI算力、通用算力、高速大带宽I/O”,大幅度卸载Host CPU的数据预处理任务,提升训练效率。


Atlas 900

据了解,Atlas 900 AI训练集群采用“HCCS、 PCIe 4.0、100G以太”三类高速互联方式,百TB全互联无阻塞专属参数同步网络,降低网络时延,梯度同步时延缩短10~70%。华为集合通信库提供训练网络所需的分布式并行库,通信库+网络拓扑+训练算法进行系统级调优,实现集群线性度>80%,极大提升了作业调度效率。

Atlas 900 AI训练集群采用全液冷方案,以及柜级密闭绝热技术,支撑>95%液冷占比。单机柜支持50kW散热功耗,实现PUE<1.1的数据中心能源效率。在空间节省方面,与8kW风冷机柜相比,节省机房空间79%。液冷散热技术满足了高功率、高密设备部署、低PUE的需求,大幅降低了客户的TCO。

目前,华为已在华为云上部署了一个Atlas 900 AI训练集群,集群规模为1024颗昇腾910 AI处理器。基于当前最典型的ResNet-50 v1.5模型”和“ ImageNet-1k数据集”,Atlas 900AI训练集群只需59.8秒就可完成训练,排名全球第一。“ ImageNet-1k数据集”包含128万张图片,精度为75.9%,在同等精度下,其他两家业界主流厂家测试成绩分别是70.2s和76.8s,Atlas 900 AI训练集群比第2名快15%。

为了帮助SKA射电望远镜解析超过20万颗星体,过去天文学家要从这20万颗星星中找出某种特征的星体,需要169天的工作量。现在用上Atlas 900,只用10秒,就能从20万颗星星中检索出了相应特征的星体,并实现精准定位。

如今,各行各业数字化、智能化转型如火如荼,计算产业蓬勃发展。可以看到,华为始终在坚定不移地投入计算产业,从最难的架构突破做起,自研处理器,以此为基础打造产业,构建生态。“我们坚信,只有克服最大的困难,才能真正构建起竞争力,才能为行业伙伴打开更大的产业空间,我们要用最好的技术,解决世界上最难的问题,把不可能变成可能。”胡厚崑谈到,“这是计算产业新的大航海时代,我们期待的是千帆竞发,而不是独舟奋进。我们期望和各行各业的伙伴共同努力,抓住历史机遇,共创智能新高度。”




您需要登录后才可以回帖 登录 | 立即注册 微信登录

本版积分规则

APP|手机版|小黑屋|关于我们|联系我们|法律条款|技术知识分享平台

闽公网安备35020502000485号

闽ICP备2021002735号-2

GMT+8, 2025-7-21 04:19 , Processed in 0.218401 second(s), 9 queries , Redis On.

Powered by Discuz!

© 2006-2025 MyDigit.Net

快速回复 返回顶部 返回列表