数码之家

 找回密码
 立即注册
搜索
查看: 294|回复: 0

[科技] 深度求索团队另辟蹊径:用"代码级调校"突破算力封* 国产GPU或迎新转机

[复制链接]
发表于 2025-2-4 21:12:27 | 显示全部楼层 |阅读模式
近日一则来自香港媒体 CNA 的爆料在科技圈引发热议:曾用低成本AI模型搅动华尔街的深度求索(DeepSeek)团队,正酝酿着一场突破算力封*的"代码革命"。这支神秘的AI研发团队凭借对NVIDIA显卡底层语言PTX的深度掌控,不仅用更少显卡跑出对标国际大厂的模型性能,更被曝正在将这套"代码魔法"移植到国产GPU平台,试图在半导体领域上演"技术突围"。

上周华尔街的剧烈震荡,正是源于DeepSeek公开的技术路线——他们通过直接调用NVIDIA显卡的PTX线程级指令,绕开了常规的CUDA编程框架,在同等算力下实现了惊人的成本压缩。这种"直接对话显卡心脏"的操作,让原本需要堆砌海量高端GPU的AI训练变得高效,直接动摇了资本市场对传统AI基建模式的信心。

知情人士透露,这种"硬核编程"的选择实则迫于现实:在美国持续加码的半导体禁令下,国内能获取的NVIDIA H800显卡无论是数量还是性能都大打折扣。但DeepSeek团队硬是通过对PTX指令集的极致优化,在7nm制程的"阉割版"显卡上跑出了对标国际5nm旗舰产品的性能表现。这种"螺蛳壳里做道场"的操作,被业内视为中国AI企业在特殊环境下的生存智慧。

更值得关注的是,这套基于PTX的底层优化技术正在酝酿"技术平移"。由于PTX本质上是对GPU运算单元的直接调度,DeepSeek工程师在摸透NVIDIA显卡运行机制后,正尝试将相似逻辑应用于国产GPU平台。尽管国产芯片目前仍受困于制造工艺限制,但通过精细的指令集优化,或许能在现有硬件条件下挤出更多性能空间。

从技术细节来看,PTX作为介于高级语言与机器码之间的"中间层",允许开发者直接操控显卡的并行线程。这种"显微镜级"的代码编写虽然难度陡增,却为性能调优打开了新维度。就像赛车手既会开车更要懂引擎,DeepSeek团队展现的正是这种"既用显卡又造显卡"的硬核实力。

半导体行业观察者指出,这种技术路线的突破具有双重意义:短期看是应对算力短缺的应急方案,长期则可能培育出适配国产硬件的AI开发体系。在ASML光刻机持续断供的背景下,SMIC等中企的7nm工艺短期内难以突破,但通过软件层面的"性能压榨",或许能为国产GPU争取到关键的成长窗口期。这场始于华尔街的AI冲击波,正在半导体领域掀起新的涟漪。

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有账号?立即注册

x
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

APP|手机版|小黑屋|关于我们|联系我们|法律条款|技术知识分享平台

闽公网安备35020502000485号

闽ICP备2021002735号-2

GMT+8, 2025-5-11 16:21 , Processed in 0.296400 second(s), 10 queries , Redis On.

Powered by Discuz!

© 2006-2025 MyDigit.Net

快速回复 返回顶部 返回列表