新京报贝壳财经讯(记者罗亦丹)2月5日,百度智能云在官方公号发文称,近日成功点亮昆仑芯三代万卡集群,这也是国内首个正式点亮的自研万卡集群。此外,百度智能云还将进一步点亮3万卡集群,百度通过自研芯片和大规模集群的建设,除了解决自身算力供应的问题外,还能为整个行业提供新的思路和方向。
从算力上看,超大规模并行计算能力可实现训练效率跃升,万卡集群可将千亿参数模型的训练周期大幅降低,满足AI原生应用快速迭代的需求。同时它也能支持万亿参数模型、复杂任务和多模态数据,支撑Sora类应用的开发。此外,万卡集群能够支持多任务并发能力,通过动态资源切分,单集群可同时训练多个轻量化模型,通过通信优化与容错机制减少算力浪费,实现训练成本指数级下降。
过去,多芯混训和激增的故障率等难题是万卡集群部署过程中的巨大挑战。对此,在2024年9月升级的百度百舸AI异构计算平台4.0,在万卡集群的建设中发挥了重要作用。此外,百度智能云千帆平台还在2月3日正式上架了 DeepSeek-R1和 DeepSeek-V3模型,此次接入的模型已全面融合千帆推理链路。
编辑 姜樊
校对 刘军