DeepSeek新版本引爆国产算力,中国AI产业拐点已至!
DeepSeek又一次点燃市场!
前脚刚发布V3.1版本,宣布模型直接适配下一代国产芯片;后脚英伟达就通知供应商,暂停了中国特供版芯片H20的生产。再结合近期,工信部要求腾讯、阿里、字节等巨头说明大量采购英伟达H20芯片的合理性,并建议采用国产替代方案。连起来看,摆明了在说一件事:中国人工智能的拐点到了,国产算力要翻身了!
本来今年市场都在等DeepSeek的R2版本,结果人家直接掏出V3.1,新架构把“深度思考”和“快速响应”两种模式合二为一,R2?可能等不到了。但最炸裂的还不是这个新架构,而是DeepSeek在官方文档里轻飘飘写的一句——“V3.1支持UE8M0 FP8精度”,官微还补了句刀:“UE8M0 FP8是针对即将发布的下一代国产芯片设计”。

这句话看着低调,实则是往芯片圈扔了颗核弹!因为国产芯片这些年太苦了——商业化难、生态差,比如昇腾910B单卡算力明明比H20强,但大厂采购时还是选H20。痛点就俩:
- 集群性能拉垮:国产卡互联带宽不够,一上多卡(比如万卡集群)性能猛跌30%。而像马斯克训练Grok4用了20万张卡,用国产卡得多花40%时间和成本。谁耗得起?
- 生态护城河太深:英伟达CUDA生态沉淀了15年,支持上万种模型;国产芯片如昇腾才支持百余种。生态越强→用户越多→对手越难活!
美国人早看透了这点,所以现在换策略了:从“一刀切封锁”变成“精准倾销”。拜登时期是什么高端芯片都不给,现在特朗普政府却可能允许卖B30A(英伟达正在研发的特供中国芯片)——性能比H20高,比国产所有芯片都强,但比顶尖芯片差一档。这招太致命了!如果中国模型公司都去买B30A,国产芯片没市场→生态建不起来→最终夭折。而中国企业拿到的算力又不是顶尖的,结果就是被美国人“锁死在中档”,永远追不上。哪天他们再断供,我们就只能任人拿捏。
这时候DeepSeek的UE8M0 FP8横空出世,就成了破局关键!
- FP8是啥? 简单说就是“数字瘦身术”——让芯片装更多数据、算更快、更省电。
- UE8M0牛在哪? 这是专门针对国产芯片优化的FP8子格式,纯国产标准(在国际FP8技术框架下,针对国产硬件特性进行的创新性突破)!显存省50%、速度提3倍、功耗降70%。
DeepSeek到底在给哪些国产芯片“开小灶”?
官方故意卖关子,我们扒了扒,起码这几家可能性很高:
- 寒武纪:头号种子选手!他家MLU370、思元590/最新690系列都支持FP8,在架构设计和低精度计算优化上一直相对比较领先,股价8月22日直接20cm涨停,市值突破5200亿。
- 海光:深算三号DCU能跑FP8,但还有优化空间。
- 沐曦:7月新发的曦云C600也支持。
- 中昊芯英:“刹那”TPU芯片直接支持FP8精度。
- 摩尔线程:国产GPU里少数原生支持FP8的,MTT S5000旗舰卡支持FP8精度计算。
- 华为昇腾:虽然910B/C暂不支持FP8,但路线图写着“2025Q4原生FP8”!猜测明年发布的昇腾910D可能就是“下一代芯片”。
这一切都释放了一个信号:中国AI进入“软硬协同”新阶段——模型厂和芯片厂深度合作,用统一标准对抗CUDA生态霸权!
现在压力全给到英伟达: H20已成鸡肋,赶紧推B30A才是正事。但国产芯片也别高兴太早——量产才是生死关!昇腾910C到6月才产出2.7万张,根本不够用。光刻机卡脖子导致良率低,接下来得等国产半导体设备突破,才能真正松一口气。
总而言之,DeepSeek V3.1的发布,标志着中国AI产业从“被动适配硬件” 转向 “定义技术标准” 的新阶段! 尽管英伟达的威胁与国产芯片量产瓶颈仍在,但软硬协同生态的成型,已为国产算力撕开一道战略突破口。若中国大模型企业坚定支持国产芯片,则人工智能的“锁死危机”或将终结于此刻。