摘要:OpenAI联合AMD、英特尔、微软等科技巨头推出MRC开放网络协议,专为大规模AI训练集群优化。该协议通过多路径传输与智能路由提升网络可靠性与效率,已在星门与沛水系统中实现超十万GPU互联部署。

币圈界报道:
OpenAI携手芯片巨头发布MRC协议,重构AI集群通信架构
OpenAI与AMD、博通、英特尔、微软及英伟达共同发布名为MRC(多路径可靠连接)的开放网络协议,旨在解决大规模人工智能训练场景下GPU间高速互联的瓶颈问题,推动算力基础设施的标准化演进。
基于RoCE与SRv6融合的智能路径调度机制
MRC在现有RoCE技术基础上,深度集成SRv6源路由能力,实现对数据流路径的精细化控制。通过将单个传输任务拆分至多个并行链路执行,显著缓解网络拥塞现象,并可在节点或交换设备失效时自动触发动态绕行,保障通信连续性与低延迟。
超大规模集群部署验证性能突破
该协议已在OpenAI与OCI共建的“星门”系统以及微软“沛水”超级计算机中完成实际应用,成功实现超过十万个GPU通过二层交换机的高效互联。部署结果显示,整体能耗下降明显,同时硬件配置数量得以精简,为下一代超大规模模型训练提供更优的网络底座。
目前,MRC的技术规范已正式提交至开放计算项目(OCP),面向全球开发者与厂商开放共享。
声明:本站所有文章内容,均为采集网络资源,不代表本站观点及立场,不构成任何投资建议!如若内容侵犯了原著者的合法权益,可联系本站删除。
