百万卡算力之路:多DC分布式训练和DCI需求增长
创始人
2024-10-08 20:42:01
0

今天分享的是:百万卡算力之路:多DC分布式训练和DCI需求增长

报告共计:11页

《百万卡算力之路:多DC分布式训练和DCI需求增长》由国联证券发布,探讨了AI大模型训练中多DC分布式训练的发展趋势以及对DCI(数据中心互联)的需求增长,主要内容如下:

- 多DC分布式训练趋势

- 海外巨头布局:Meta、Google已开展多DC分布式训练,如Google的Gemini 1 Ultra。谷歌在俄亥俄州和爱荷华州/内布拉斯加州有主要数据中心区域,OpenAI和微软计划更大规模的分布式训练。

- 网络挑战:AI训练进入十万卡时代,跨DC协同训练面临挑战。AI训练对网络丢包敏感,大象流会使传统负载分担方法失效,万卡集群中流量瞬时并发量大。目前十公里跨机楼并行训练算效损失可控,未来百公里、千公里级跨地域并行训练需控制损失,涉及多种技术和长距离超宽DCI网络建设。

- DCI互联方案及市场

- 互联方案:更大带宽可通过高阶调制或DWDM实现。400G ZR相干光学技术有望取代传统WDM系统,更简洁,采用相干光模块。不同DCI场景选择不同产品,园区内部优先选择光缆+LR光模块,跨园区选择DWDM+ZR光模块。

- 市场空间:根据预测,2024 - 2028年,400G LR、400G ZR等多种光模块出货量和市场规模将增长,400G ZR产品价值量也将增长。

-

以下为报告节选内容

相关内容

热门资讯

澎湃五问三大运营商:新老用户待... 澎湃新闻记者 吴雨欣 6月9日,澎湃新闻发布独家调查报道,引发网民广泛共鸣,多家媒体跟进报道、评论,...
跨境床上用品卖家如何处理海外消... 对于跨境床上用品卖家来说,美国市场一直是最重要的销售目的地之一。从床单、被套、枕套到羽绒被、床垫保护...
原创 伦... 如果你们马刺把福克斯的2.2亿美金合同给了我,那么你们早就4:0横扫尼克斯,拿到总冠军了,我如今在快...
原创 老... 老员工如何不被裁员?为什么一对老员工动手,公司就出事?不晋升老员工的代价很多企业应该是伤不起的,老员...
上交所:AI大模型企业适用科创... IT之家 6 月 18 日消息,上海证券交易所昨日(6 月 17 日)发布指引,支持尚未形成一定收入...
华为申请「世界」汽车类商标:此... 6月17日,据IT之家,国家知识产权局公示商标注册进展显示,华为技术有限公司提交的汽车类“世界”商标...
中国机器人技术突破沙漠治理难题... 中国机器人开始治理沙漠了 沙漠治理的千年难题与技术破局 中国是世界上受沙漠化危害最严重的国家之一...
振华风光申请实时系统存储接口控... 国家知识产权局信息显示,贵州振华风光半导体股份有限公司申请一项名为“一种实时系统的存储接口控制方法、...
豆包为何上新付费订阅方案?读懂... 每一家提供国产大模型服务的企业,生存的根基不仅在于算法模型本身,更与稳定的网络通信服务以及不可或缺的...