AGI不会突然降临!Karpathy给AI圈浇了一盆冷水
2025年,被无数人称作“智能体元年”。
DeepSeek在若干公开基准上领先GPT-4o、OpenAI推出Agents SDK与AgentKit、Anthropic约10周内连发三版Claude模型——行业像是踩下了加速键。社交媒体上充满着“AGI即将到来”的论调,仿佛人类文明正站在智能爆发的前夜。
然而,一位业内最具分量的声音,却泼来一盆冷水。
前OpenAI核心研究员、特斯拉自动驾驶负责人 Andrej Karpathy 在2025年10月18日与Dwarkesh Patel的对谈中表示:
“即便2025被称作‘智能体之年’,真正成熟仍需约一个十年。AGI不会在某个年份‘爆发’,而是一条由持续改进铺就的长曲线。”
这句话,像是给狂热的行业按下了暂停键。
一、被“元年”淹没的理性:AI的速度幻觉
回望这一年,几乎每一次模型发布都被包装成“划时代的时刻”。DeepSeek-V3在MMLU等若干基准上分数高于GPT-4o,成为中国团队首个接近OpenAI顶级模型的成果;OpenAI于2025年3月11日发布Agents SDK ,并在10月6日推出AgentKit 强化智能体生态;Anthropic则在约十周内连推Opus 4.1、Sonnet 4.5、Haiku 4.5 三版模型,令市场惊呼“AI进入指数级加速期”。
但冷静看,这更像是一次由算力堆叠、数据优化和工程整合 驱动的“表面爆发”。
算法的创新正在放缓。Transformer框架自2017年诞生以来,已被榨干了几乎所有增益;参数量再翻倍,性能提升却趋于边际;推理、记忆、目标设定等通用智能所需的核心能力,仍在原地踏步。
Karpathy的提醒,道出了行业的实质:
我们并不是在通向AGI的快车道上疾驰,而是在一个宽阔的、渐进的爬坡期。
市场与公众产生了“速度幻觉”,是因为AI的可视化进展太直观。一个能写文案、作曲、甚至写代码的模型,让人感觉智能正在接近人类。但在技术维度上,这种“近似能力”与“通用智能”之间,隔着至少几十年的工程鸿沟。
二、从“模型竞速”到“智能架构”:AGI的真实门槛
AI的真正进化,不仅是模型更大、更快,而是要具备自主性、持续学习与目标导向 。Karpathy称之为“从训练到生长”的转变。
当前的主流模型仍然是“封闭式学习”体系——通过离线数据训练一次成型,无法像人类一样持续积累经验 。它们看似强大,却是静止的。要走向AGI,至少需要跨过三道关键门槛:
1. 记忆与状态管理
现有模型在会话间“失忆”,无法保留长期经验。真正的智能体需要拥有“记忆堆栈”,能像人类一样形成世界模型——记住过去、推演未来、修正策略。
OpenAI和Anthropic的Agent系统正试图解决这一点,但离“自我记忆”仍相当遥远。
2. 推理与因果理解
当前模型的推理本质是“统计预测”,不具备因果推断能力。它能总结规律,却无法理解“为什么”。
DeepSeek的逻辑链改进值得关注,它引入了符号推理模块,但这仍是混合式尝试 ,远未触及真正的逻辑思维。
3. 能量效率与算力极限
大型模型训练与推理的能耗极高。公开研究估算,GPT-3 的训练约耗电 1,287 MWh(约合130户美国家庭一年的用电) ;随着AI数据中心扩张,IEA预测到2030年全球数据中心用电量可能翻倍至约945TWh(太瓦时) 。
GPT-4级模型的能耗尚无权威公开数据 ,因此不宜直接类比“城市级用电”。
Karpathy过去在特斯拉负责自动驾驶芯片设计,他深知这一点——AGI不是算力线性放大,而是架构革命。
这意味着,AI的发展正在从“模型竞速”阶段过渡到“智能架构”阶段。谁能在这一阶段建立可扩展的计算范式,谁才是下一个时代的霸主。
三、AGI的长曲线:从商业智能到自演化系统
如果把AI的发展放在时间轴上,可以看到一个三阶段演化路线图 ,也可视为未来十年的投资坐标。
第一阶段(2020–2025):商业智能阶段
这是以ChatGPT为代表的阶段——AI成为生产力工具。
企业用AI写文案、客服、编程、翻译,AI的价值主要体现在效率提升与成本替代 。这阶段的赢家是OpenAI、Anthropic、百度、Google等拥有模型与云算力的头部公司。
第二阶段(2025–2030):智能体生态阶段
从工具到伙伴。
Agent成为核心概念,AI不再被动响应,而能主动执行任务:整理邮箱、下单采购、编写代码、优化营销投放。
这正是2025年被称作“智能体元年”的原因——它标志着AI从“文本生成”迈向“行动执行”。但要形成真正生态,仍需三大支撑:
·开放标准(如Agents SDK与AgentKit)
·跨平台协作(工具调用与API互通)
·安全与信任系统(防止AI越权行为)
这一阶段的产业机会将集中在智能体基础设施与中间件层 ,即“AI的操作系统”——谁能提供通用调用框架、任务调度和记忆体系,谁就拥有新的“Windows时刻”。
第三阶段(2030年后):自演化系统阶段
AGI的曙光才会出现。
届时的AI不再依赖单一模型,而是由成千上万的子智能体组成的“群体系统”,它们会互相协作、竞争、进化,具备类似生物生态的自我组织能力。
这将是一个新的计算文明,而非单一产品。Karpathy所说的“长曲线”,正是指向这一阶段。
四、资本的躁动与技术的耐心
市场的躁动来自于时间错配。资本按季度计算回报,而技术以十年为单位成长。
从Transformer到AGI,路径上仍有几十个未解的问题:从世界模型的构建,到跨模态感知的统一,再到算力成本与能耗优化——每一个都可能耗费数年。
但资本并不等待。
AI创业公司融资动辄上亿美元,估值高企;GPU供给紧张、云服务费率上升、模型部署成为竞争壁垒。这种环境下,企业与投资人极易产生“今年必须兑现”的幻觉。
Karpathy的观点无疑是一种提醒:
真正改变世界的技术,从来不是在媒体热潮中诞生的,而是在工程师的长夜里被一点点磨出来的。
AI不是一场百米冲刺,而是一场马拉松式的技术复利 。而复利的前提,是对噪音保持免疫。
五、未来十年:AGI的战略推演
如果我们沿着Karpathy的思路,把“长曲线”翻译成未来十年的战略地图,可以得出以下推演:
1. 短期(2025–2027):从模型到系统
· 模型增速放缓,Agent生态成为增量方向。
· 开放式接口、任务分解、自动化管控成为主战场。
· 投资机会在AI中间层与行业定制化智能体 ,如企业知识管理、营销、金融分析等。
2. 中期(2027–2030):多智能体协同与自治系统
· 多Agent协同框架(如“社会化AI”)将崭露头角。
· 模型不再单体训练,而是通过“任务网络”互相学习。
· 数据不再是“被动输入”,而成为系统反馈的一部分。
· 投资焦点转向智能体协调框架、仿真环境与数字孪生系统 。
3. 长期(2030年后):AGI的生态化生长
· AGI不再指一个模型,而是一个生态。
· 其核心竞争力来自三点:能效架构、世界模型、伦理机制 。
· 经济层面,AI将进入“物理世界”,与机器人、自动驾驶、能源管理深度融合。
· 投资逻辑将从“技术红利”转向“社会结构重构”。
换句话说:AGI不是一个节点,而是一条曲线的积累。
谁能在长坡上坚持得更久,谁就有机会在拐点出现时掌握主动权。
六、结语:在长坡上积累,而非在幻觉中狂奔
在“智能体元年”的喧嚣里,Karpathy的那句话显得格外冷静。
它提醒我们:AGI不是时间表上的一行,而是一种持续进化的过程。
人类往往高估短期变化,低估长期变革。正如互联网的爆发不是诞生于1999年的泡沫,而是在此后十年的应用沉淀中。AI的革命也会如此——它不会在某个夜晚突然到来,而是会在无数次“微小升级”的堆叠中,慢慢渗透一切。
真正的智慧,不在预测何时抵达终点,而在选择在哪条路上耐心行走。