API砍价50%,国产芯片“Day 0”适配,DeepSeek要搞大事情
9月29日,深度求索(DeepSeek)同步发布实验性大模型DeepSeek-V3.2-Exp,并在Hugging Face开源;同时宣布API调用价格大幅下调,整体成本下降50%+。
这一动作引发了国产算力厂商的快速响应:华为昇腾、寒武纪、海光信息均同步宣布完成适配,并相继公布推理引擎或代码支持方案。
这不是一次常规的模型小升级,而是一场面向全行业的“协同演示”——架构实验+价格下探+芯片同步重磅发布,共同释放出一个信号:国产AI产业链正从“单点突破”迈向“体系协同”。
一、架构实验:稀疏Attention带来效率新路径
在大模型的发展历程中,算力消耗和推理效率始终是最大瓶颈。尤其在长文本任务中,标准 Attention 的计算复杂度随序列长度呈平方级增长,每多一个 token,计算量都会急剧增加。
DeepSeek-V3.2-Exp的核心创新,就是引入了DeepSeek Sparse Attention(稀疏注意力,DSA)。其机制包含两个关键组件:
Lightning Indexer(闪电索引器):快速评估新token与历史token的相关性。
细粒度选择机制:只挑选最相关的一部分上下文进入注意力计算。
这样,传统注意力机制的二次方复杂度被降到近似线性,意味着长文本推理的算力开销显著降低。
不过,它的取舍也引发讨论。一些开发者在实测中发现:代码生成和复杂推理的稳定性略有下降,例如输出更简短、偶尔出现逻辑不完整的情况。这与官方的定位一致:V3.2-Exp是实验性版本,更重要的是探索效率与成本的新平衡,而非单纯追求性能的极致。
二、价格下探:百万Token只要3元
与技术架构同步亮相的,是一次“杀到骨头”的价格调整。
DeepSeek宣布,API调用成本整体下降50%+;其中,输出token的价格降至3元/百万,约为上一代的1/4。
对开发者而言,这几乎接近“免费体验”。有网友直言:“用DeepSeek生成长文档,现在比开个网盘还便宜。”
对产业链而言,这是一次典型的以价换量:
短期牺牲利润,换取开发者规模和应用生态。
在开发者圈子站稳脚跟,才能推动下游行业应用普及。
与OpenAI、Anthropic保持高价的策略相比,DeepSeek显然选择了一条更激进的扩张路线。
三、产业协同:昇腾、寒武纪、海光的“集体响应”
这一次最让业内惊讶的,是国产芯片厂商的同步动作。在DeepSeek发布消息当日,昇腾、寒武纪、海光同日宣布完成适配。
华为昇腾:宣布基于vLLM/SGLang推理框架快速完成部署,实现Day 0支持,并面向开发者开源全部推理代码和算子。官方数据显示,在128K长序列推理中,首token输出延迟(TTFT)低于2秒,每token输出延迟(TPOT)低于30毫秒,推理性能达到行业领先水准。
寒武纪:在官方渠道发文称,已同步完成对V3.2-Exp的适配,并开源vLLM-MLU推理引擎源代码。通过Triton算子开发和BangC融合算子优化,再加上计算与通信的并行策略,寒武纪实现了更高的算力利用率,尤其在长序列推理中显著降低成本。
海光信息:宣布其DCU已实现无缝适配+深度调优,实现近零等待的部署体验。海光特别强调,依托GPGPU架构和开发栈DTK的生态优势,V3.2-Exp在DCU上展现了高通用性、强兼容性与自主可控的特征。
三家厂商的“集体响应”传递出一则重要信号:国产芯片不再局限于“被动追赶”的定位,而是实现了关键突破——可与头部大模型厂商在其产品发布当天,同步官宣适配成果。
这种“节奏对齐”背后,是更紧密的软硬件协同,也是国产算力生态加速成熟的表现。
四、从性能到生态:一个“协同实验”的意义
从技术到价格,再到产业链,这一系列动作更像是一场完整的“协同实验”:
架构侧:通过稀疏Attention验证效率优先的可能路径。
商业侧:通过大幅降价测试“以价换量”的开发者增长效果。
产业侧:通过芯片厂Day 0适配,展示软硬件协同的可行性。
这使得V3.2-Exp的意义,已经超越了“性能升级”。它代表的是国产AI产业链协同的雏形。
有网友称之为这是“第二个DeepSeek时刻”。
五、全球对照:成本战vs入口战
把这次DeepSeek的动作与OpenAI的“即时结账”放在一起,就能看到全球AI产业的两条主线:
DeepSeek代表的国产厂商:在打成本战,通过架构创新+国产芯片协同,把推理成本压到极致,让AI变得更“用得起”。
OpenAI代表的国际厂商:在打入口战,通过购物与支付闭环,把AI变成新的交易入口,加速商业变现。
这两条路线并不是对立,而是互补:
成本降不下来,AI应用很难大规模落地。
应用变现不跑通,成本投入也难以持续。
一个拼底座,一个拼入口。全球AI的格局,正在这两条战线同时推进。
六、中国市场的特殊意义
对于中国而言,这场“Day 0时刻”尤其关键:
自主可控:长期以来,国产芯片受制于生态劣势。如今,昇腾、寒武纪、海光能够同步宣布完成适配,说明生态壁垒正在被突破。
政策驱动:国家层面持续强调算力国产化,产业链协同正是政策落地的体现。
市场需求:政企、金融、制造等行业对长文档推理和合规内网有刚性需求,价格下降+芯片适配为国产AI提供了更现实的落地路径。
这让“国产替代”的逻辑进一步从“故事”走向“兑现”。
七、成本革命能否转化为资本故事?
一方面,市场情绪迅速升温,寒武纪、海光信息等概念股受到资金追捧;另一方面,大幅降价虽然可能在短期压缩利润空间,但如果能够快速绑定开发者,反而有助于形成生态护城河,支撑中期估值;更长期来看,若软硬件协同闭环能够真正跑通,中国AI产业将展现更强的独立性,有望逐步孕育出“国产算力+国产模型”的新估值逻辑。
不过,风险也需提示:
V3.2-Exp是实验性架构,真实业务的泛化效果仍待验证;
价格下探意味着盈利质量承压,需要观察能否用规模抵消毛利下滑。
八、总结
** **
DeepSeek-V3.2-Exp的发布,不仅仅是一次技术迭代,而是一场“实验性的拐点”:
架构创新,探索效率优先的新路径;
价格下探,让开发者几乎零门槛接入;
芯片适配,标志着国产AI产业链的协同加速。
这场协同实验,意味着中国AI正在从“单点突破”迈向“体系协同”。
如果说OpenAI的“即时结账”是应用层的入口突破,那么DeepSeek的V3.2-Exp就是底层的成本革命。两条路径共同推动一个目标:让AI从炫技走向可用,从昂贵走向普及。
而国产AI的“Day 0时刻”,或许正是这一进程中的关键节点。