数码之家

 找回密码
 立即注册
搜索
查看: 161|回复: 0

[概念] SHMT 技术推动计算变革:不动硬件,速度翻番、能耗减半

[复制链接]
发表于 2024-2-25 20:48:53 | 显示全部楼层 |阅读模式

爱科技、爱创意、爱折腾、爱极致,我们都是技术控

您需要 登录 才可以下载或查看,没有账号?立即注册

x
在第 56 届 IEEE / ACM 微体系结构国际研讨会上,美国加州大学河滨分校(UCR)的研究人员展示了一种全新的方法,可以实现计算速度翻番、能耗减半的效果。

                               
登录/注册后可看大图
研究人员表示这项技术理论上适用于从智能手机到数据中心服务器的任何处理器和加速器,但需要进一步地开发适配。
加利福尼亚大学电气与计算机工程系副教授、本研究报告的共同作者曾宏伟(Hung-Wei Tseng)表示:
你不需要增加新的处理器,可以在现有计算机平台上部署。这项技术的核心,是帮助你更合理高效地管理可用硬件资源。
研究人员开发的平台打破了传统的编程模式,团队将其称为同步异构多线程(SHMT)。传统编程模式是在一段时间内,只向系统的一个计算组件(中央处理器、图形处理器、张量处理器或其他处理器或加速器)提供数据,而 SHMT 技术在所有组件之间同时并行执行代码。

                               
登录/注册后可看大图
传统、现代异构和 SHMT 的并行化方法比较
SHMT 采用质量感知工作偷取(QAWS)调度策略,保持平衡控制计算质量和工作负载,因此降低了资源调用。
SHMT runtime 系统将创建一组虚拟操作(vOPS),并划分为一个或多个高级操作(HLOP),以便同时使用多个硬件资源。

                               
登录/注册后可看大图
根据所选政策加速 SHMT 计算

                               
登录/注册后可看大图
传统计算与 SHMT 的活动和闲置消耗比较
SHMT runtime 系统将 HLOPS 分配到任务队列,在目标硬件上运行。由于 HLOPS 与硬件无关,runtime 系统可根据需要将任务重定向到计算平台的一个或另一个组件。
研究人员以他们创建的测试平台为例,展示了新软件库的有效性。他们创造了一种混合体,既可以被视为智能手机,也可以被视为一种个人电脑,甚至是服务器。

                               
登录/注册后可看大图
该测试平台基于一块带有 PCIe 接口的背板,一台搭载英伟达 Nano Jetson 模块组的“计算单元”,通过 M.2 Key E 插槽连接谷歌 Edge 加速器(TPU)。该模块带有四核 ARM Cortex-A57 处理器(CPU)和 128 个 Maxwell 架构图形内核(GPU)。
本系统的主内存为 4 GB LPDDR4,频率为 1600 MHz,速度为 25.6 Gbps,用于存储一般数据。Edge TPU 模块额外包含 8 MB 内存,并使用 Ubuntu Linux 18.04 作为操作系统。
在一个使用标准测试应用程序的简易异构平台上运行 SHMT 软件包的结果表明,与基本计算分配方法相比,采用最有效策略的 QAWS 框架的计算速度提高了 1.95 倍,消耗显著降低了 51%。
这种方法如果应用于数据中心,可以在保持现有硬件不变的情况下,最大化性能收益。目前,所提出的解决方案尚未准备好付诸实施,但肯定会有很多人对此感兴趣。

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

APP|手机版|小黑屋|关于我们|联系我们|法律条款|技术知识分享平台

闽公网安备35020502000485号

闽ICP备2021002735号-2

GMT+8, 2024-4-29 08:04 , Processed in 0.202801 second(s), 10 queries , Redis On.

Powered by Discuz!

© 2006-2023 smzj.net

快速回复 返回顶部 返回列表