DeepSeek新版本引爆国产算力，中国AI产业拐点已至！

2025-08-24 作者: 预见大模型 AI芯片顶级公司 #AI芯片 #顶级公司

原文链接： https://www.yjnt111.top/article/230

DeepSeek又一次点燃市场！

前脚刚发布V3.1版本，宣布模型直接适配下一代国产芯片；后脚英伟达就通知供应商，暂停了中国特供版芯片H20的生产。再结合近期，工信部要求腾讯、阿里、字节等巨头说明大量采购英伟达H20芯片的合理性，并建议采用国产替代方案。连起来看，摆明了在说一件事：中国人工智能的拐点到了，国产算力要翻身了！

本来今年市场都在等DeepSeek的R2版本，结果人家直接掏出V3.1，新架构把“深度思考”和“快速响应”两种模式合二为一，R2？可能等不到了。但最炸裂的还不是这个新架构，而是DeepSeek在官方文档里轻飘飘写的一句——“V3.1支持UE8M0 FP8精度”，官微还补了句刀：“UE8M0 FP8是针对即将发布的下一代国产芯片设计”。

这句话看着低调，实则是往芯片圈扔了颗核弹！因为国产芯片这些年太苦了——商业化难、生态差，比如昇腾910B单卡算力明明比H20强，但大厂采购时还是选H20。痛点就俩：

集群性能拉垮：国产卡互联带宽不够，一上多卡（比如万卡集群）性能猛跌30%。而像马斯克训练Grok4用了20万张卡，用国产卡得多花40%时间和成本。谁耗得起？
生态护城河太深：英伟达CUDA生态沉淀了15年，支持上万种模型；国产芯片如昇腾才支持百余种。生态越强→用户越多→对手越难活！

美国人早看透了这点，所以现在换策略了：从“一刀切封锁”变成“精准倾销”。拜登时期是什么高端芯片都不给，现在特朗普政府却可能允许卖B30A（英伟达正在研发的特供中国芯片）——性能比H20高，比国产所有芯片都强，但比顶尖芯片差一档。这招太致命了！如果中国模型公司都去买B30A，国产芯片没市场→生态建不起来→最终夭折。而中国企业拿到的算力又不是顶尖的，结果就是被美国人“锁死在中档”，永远追不上。哪天他们再断供，我们就只能任人拿捏。

这时候DeepSeek的UE8M0 FP8横空出世，就成了破局关键！

FP8是啥？简单说就是“数字瘦身术”——让芯片装更多数据、算更快、更省电。
UE8M0牛在哪？这是专门针对国产芯片优化的FP8子格式，纯国产标准（在国际FP8技术框架下，针对国产硬件特性进行的创新性突破）！显存省50%、速度提3倍、功耗降70%。

DeepSeek到底在给哪些国产芯片“开小灶”？

官方故意卖关子，我们扒了扒，起码这几家可能性很高：

寒武纪：头号种子选手！他家MLU370、思元590/最新690系列都支持FP8，在架构设计和低精度计算优化上一直相对比较领先，股价8月22日直接20cm涨停，市值突破5200亿。
海光：深算三号DCU能跑FP8，但还有优化空间。
沐曦：7月新发的曦云C600也支持。
中昊芯英：“刹那”TPU芯片直接支持FP8精度。
摩尔线程：国产GPU里少数原生支持FP8的，MTT S5000旗舰卡支持FP8精度计算。
华为昇腾：虽然910B/C暂不支持FP8，但路线图写着“2025Q4原生FP8”！猜测明年发布的昇腾910D可能就是“下一代芯片”。

这一切都释放了一个信号：中国AI进入“软硬协同”新阶段——模型厂和芯片厂深度合作，用统一标准对抗CUDA生态霸权！

现在压力全给到英伟达： H20已成鸡肋，赶紧推B30A才是正事。但国产芯片也别高兴太早——量产才是生死关！昇腾910C到6月才产出2.7万张，根本不够用。光刻机卡脖子导致良率低，接下来得等国产半导体设备突破，才能真正松一口气。

总而言之，DeepSeek V3.1的发布，标志着中国AI产业从“被动适配硬件” 转向 “定义技术标准” 的新阶段！ 尽管英伟达的威胁与国产芯片量产瓶颈仍在，但软硬协同生态的成型，已为国产算力撕开一道战略突破口。若中国大模型企业坚定支持国产芯片，则人工智能的“锁死危机”或将终结于此刻。