|
近日一则来自香港媒体 CNA 的爆料在科技圈引发热议:曾用低成本AI模型搅动华尔街的深度求索(DeepSeek)团队,正酝酿着一场突破算力封*的"代码革命"。这支神秘的AI研发团队凭借对NVIDIA显卡底层语言PTX的深度掌控,不仅用更少显卡跑出对标国际大厂的模型性能,更被曝正在将这套"代码魔法"移植到国产GPU平台,试图在半导体领域上演"技术突围"。
上周华尔街的剧烈震荡,正是源于DeepSeek公开的技术路线——他们通过直接调用NVIDIA显卡的PTX线程级指令,绕开了常规的CUDA编程框架,在同等算力下实现了惊人的成本压缩。这种"直接对话显卡心脏"的操作,让原本需要堆砌海量高端GPU的AI训练变得高效,直接动摇了资本市场对传统AI基建模式的信心。
知情人士透露,这种"硬核编程"的选择实则迫于现实:在美国持续加码的半导体禁令下,国内能获取的NVIDIA H800显卡无论是数量还是性能都大打折扣。但DeepSeek团队硬是通过对PTX指令集的极致优化,在7nm制程的"阉割版"显卡上跑出了对标国际5nm旗舰产品的性能表现。这种"螺蛳壳里做道场"的操作,被业内视为中国AI企业在特殊环境下的生存智慧。
更值得关注的是,这套基于PTX的底层优化技术正在酝酿"技术平移"。由于PTX本质上是对GPU运算单元的直接调度,DeepSeek工程师在摸透NVIDIA显卡运行机制后,正尝试将相似逻辑应用于国产GPU平台。尽管国产芯片目前仍受困于制造工艺限制,但通过精细的指令集优化,或许能在现有硬件条件下挤出更多性能空间。
从技术细节来看,PTX作为介于高级语言与机器码之间的"中间层",允许开发者直接操控显卡的并行线程。这种"显微镜级"的代码编写虽然难度陡增,却为性能调优打开了新维度。就像赛车手既会开车更要懂引擎,DeepSeek团队展现的正是这种"既用显卡又造显卡"的硬核实力。
半导体行业观察者指出,这种技术路线的突破具有双重意义:短期看是应对算力短缺的应急方案,长期则可能培育出适配国产硬件的AI开发体系。在ASML光刻机持续断供的背景下,SMIC等中企的7nm工艺短期内难以突破,但通过软件层面的"性能压榨",或许能为国产GPU争取到关键的成长窗口期。这场始于华尔街的AI冲击波,正在半导体领域掀起新的涟漪。
|
本帖子中包含更多资源
您需要 登录 才可以下载或查看,没有账号?立即注册
x
|