预见

12家巨头联手,开放以太网成AI时代新共识

原文链接: https://www.yjnt111.top/article/852

近日,在美国加州圣何塞举办的开放计算项目(OCP)全球峰会上,一个明显的趋势逐渐清晰:面向人工智能和高性能计算的下一代基础设施,正在从传统封闭的网络架构,转向更开放、更灵活的“开放以太网”模式。

为什么选择开放以太网?

随着生成式AI和大语言模型的迅猛发展,这类应用的训练和推理任务通常需要数千乃至数万的加速器(例如GPU)协同工作。节点之间的通信效率,尤其是网络的带宽和延迟,成为影响整个计算集群效率的重要瓶颈。

过去,InfiniBand(无限带宽互连)这种专有网络技术(由英伟达旗下Mellanox主导)凭借其超低延迟和高吞吐性能成为首选。但它的缺点也十分明显——生态封闭、成本高昂,且存在供应商锁定风险。传统的以太网虽然广泛使用,但在面对大规模AI集群时,缺乏无损传输、有效的拥塞控制和足够的扩展能力,因而显得力不从心。

行业巨头们的联合推动

面对这样的局面,越来越多的科技企业选择共同推动开放的以太网架构发展。其中最具代表性的,是超以太网联盟正推动面向AI/HPC的开放以太网路线,旨在打造一个基于以太网技术、同时满足AI与HPC严格需求的通信体系。

本次峰会上,传统竞争对手英伟达和超威半导体(AMD)携手,与微软、Meta、博通、思科等企业共同宣布成立ESUN工作组。这一事件标志着超以太网正从概念走向实际部署的主流。

为什么是以太网?

选择以太网并非偶然,而是几个现实因素共同推动的结果:

生态成熟 :以太网在物理层(芯片、光模块、线缆)和管理软件方面均已积累数十年的经验,产业链丰富,方案选择余地大。

成本低廉 :以太网的硬件成本可能仅为InfiniBand的一半甚至更低;在人员培训和系统维护方面,以太网更易于管理,成本也更具竞争力。

扩展能力强 :以太网交换机拥有高端口密度,适合搭建大规模网络,有能力支撑万级、并向更大规模演进的GPU互联。

战略灵活性 :采用开放式网络可以有效避免供应商锁定的风险,提升系统灵活性,降低长期运营风险。

挑战与机遇并存

然而,以太网并非没有挑战:

目前以太网在无损通信、极低延迟和高带宽方面,与专有技术相比仍有一定差距。

选择以太网意味着企业需投入更多资源进行技术优化、网络架构设计和日常运维,与InfiniBand“即插即用”的便捷性相比,前期投入精力更大。

未来前景与趋势

从OCP此次峰会释放出的信号来看,美国科技巨头们正在集体推动基础设施从封闭走向开放式以太网。这不仅是一次技术方案的变革,更是产业战略上的重要调整。

未来,随着技术的不断成熟和以太网在高性能计算领域的技术瓶颈逐步被克服,其总拥有成本优势将更加明显。对于希望构建下一代AI数据中心的企业来说,开放以太网是值得重点关注、并具备提前布局价值的方向之一。

© 2025 AI资讯 - 用冷静的智慧预见下一个未知

京ICP备2025144713号-1

主体备案单位:北京预见花开网络科技有限公司