昇腾950PR登场:华为AI芯片的三年跃迁与市场回响
9月18日,华为在一场技术发布会上揭开了未来三年昇腾AI芯片的演进路线图,核心亮点是——昇腾950PR将在2026年第一季度正式亮相。
会上,华为副董事长徐直军还宣布,后续将在2026年四季度推出昇腾950DT,2027年四季度推出昇腾960芯片,2028年四季度推出昇腾970芯片。
这不是一次简单的迭代,而是一场架构级的跃迁。昇腾950PR不仅采用自研HBM(高带宽内存),还在算力、能效、生态兼容性等方面做出了系统性升级。这颗芯片的推出,意味着华为在AI芯片领域的战略布局进入了一个新阶段。
昇腾950PR:参数背后的野心
昇腾950PR的核心参数目前已部分披露。根据华为官方发布的信息,这款芯片将采用华为自研的HBM技术,进一步提升内存带宽与数据吞吐能力。HBM的引入,意味着芯片在处理大规模AI模型时将具备更强的并行计算能力和更低的延迟。
据透露,昇腾950PR/DT微架构将升级为SIMD/SIMT,算力达到1PFLOPS(FP8)/2PFLOPS(FP4),支持FP32/HF32/FP16/BF16/FP8/MXFP8/HiF8/MXFP4/HiF4等数据格式,互联带宽为2TB/s。
之后的昇腾960、970微架构均为SIMD/SIMT,算力分别翻倍至2PFLOPS(FP8)/4PFLOPS(FP4)和4PFLOPS(FP8)/8PFLOPS(FP4)。
更值得关注的是能效比。华为在发布会上强调,950PR将采用新一代制程工艺,并优化功耗控制逻辑,使得单位算力的能耗降低30%以上。这一指标对于数据中心部署至关重要,意味着在同等算力下,运营成本将显著下降。
三年规划:昇腾芯片的进化路径
华为此次不仅发布了950PR,还同步公布了未来三年的昇腾芯片演进规划:
昇腾PR系列 :提升推理Prefill(AI推理过程中的关键阶段)性能,搭载自研HBM——HiBL1.0
昇腾DT系列 :提升推理Decode(解码)性能、训练性能,还提升内存容量和带宽。
从产业角度看,昇腾芯片的迭代将带动上下游生态的重构。服务器厂商、算法公司、数据中心运营商都在重新评估与昇腾芯片的兼容性与合作可能。尤其是昇腾950PR采用自研HBM,意味着华为在存储接口层面也将摆脱部分外部依赖,这对国产芯片生态是一种深层次的赋能。
华为副董事长徐直军就表示,超节点成为AI基础设施建设新常态,目前CloudMatrix384超节点累计部署300+套,服务20+客户。华为将推出全球最强超节点Atlas950SuperPoD,算力规模8192卡,预计于今年四季度上市。
技术演进与战略意图:华为的双重下注
昇腾950PR的推出,不只是一次技术升级,更是华为在AI芯片领域的战略下注。在全球AI算力竞争日益激烈的背景下,华为选择自研HBM,意味着其在底层架构上寻求更高的自主权。
这一选择并不轻松。HBM技术门槛极高,涉及封装、散热、接口协议等多个环节。华为此前主要依赖外部HBM供应商,如SK海力士与美光。此次自研,意味着华为在芯片封装与内存控制器方面已取得关键突破。
此外,昇腾950PR的推出时间点也颇具战略意味。2026年第一季度,正值全球AI大模型进入商业化加速期。950PR的高算力与低能耗特性,恰好契合这一阶段的市场需求。
风险与挑战:技术之外的考验
尽管昇腾950PR备受期待,但挑战仍然存在。首先是生态兼容性。AI芯片的成功不仅取决于硬件性能,更依赖于软件栈的成熟度。昇腾系列目前已支持主流深度学习框架如TensorFlow与PyTorch,但在模型迁移与性能调优方面仍需优化。
其次是供应链稳定性。自研HBM虽然提升了自主性,但也带来了新的供应链压力。HBM的制造涉及高精度封装与测试,任何环节的波动都可能影响芯片交付周期。美国及全球其他国家政府的决策,市场的稳定性都会影响这款产品的生存环境。
最后是市场接受度。昇腾芯片在国内市场已建立一定口碑,但在国际市场仍面临品牌认知与技术信任的双重壁垒。950PR若要走向全球,还需在标准化、认证体系等方面做出更多努力。
昇腾950PR的意义,不止于芯片
昇腾950PR的发布,是华为在AI芯片领域的一次重要跃迁。它不仅代表着技术的进步,更是国产算力体系的一次集体突破。在全球AI算力格局重塑的关键节点,华为选择以自研HBM为突破口,展现了其在底层技术上的战略定力。
未来三年,昇腾芯片将持续演进,覆盖更多应用场景。950PR只是起点,真正的竞争才刚刚开始。