摘要:OpenAI联合AMD、英特尔、微软、英伟达与博通共同推出MRC开放网络协议,专为大规模AI训练集群优化,通过多路径传输与智能路由提升可靠性与能效,已在星门与沛水系统中实现超十万GPU级联部署。

币圈界报道:
OpenAI协同五家科技巨擘发布MRC互联协议
OpenAI与AMD、博通、英特尔、微软及英伟达联合宣布推出名为MRC(多路径可靠连接)的新型开放网络协议,该协议聚焦于高密度GPU集群在分布式人工智能训练场景下的高效通信需求。
基于RoCE与SRv6的融合架构实现链路弹性
MRC在原有RoCE协议基础上集成SRv6源路由机制,创新性地将单个数据流拆分至多个并行通道传输。这一设计不仅显著缓解了关键节点的拥塞压力,更可在任一链路或交换设备失效时实现毫秒级自动切换,极大增强了网络系统的容错能力与运行连续性。
超大规模算力平台已验证协议效能
该协议已在OpenAI与OCI共建的“星门”计算系统以及微软“沛水”超级计算机中完成实际部署,成功构建起跨越二层交换架构、连接超过十万颗GPU的高性能计算网络。应用结果显示,系统整体功耗下降明显,同时硬件冗余配置得以精简,有效降低基础设施投入成本。
目前,MRC的技术规范已正式提交至开放计算项目(OCP),向全球开发者与厂商开放共享。
声明:本站所有文章内容,均为采集网络资源,不代表本站观点及立场,不构成任何投资建议!如若内容侵犯了原著者的合法权益,可联系本站删除。
