昇腾原生！华为发布准万亿模型Pangu Ultra MoE模型架构和训练细节_科技资讯_一品科技

昇腾原生！华为发布准万亿模型Pangu Ultra MoE模型架构和训练细节

创始人

2025-05-31 01:20:26

0次

封面新闻记者张越熙

5月30日，记者了解到，近日华为推出了参数规模高达7180亿的全新模型——盘古Ultra MoE，这是一个全流程在昇腾AI计算平台上训练的准万亿MoE模型。华为同时发布了盘古Ultra MoE模型架构和训练方法的技术报告，披露了技术细节。

记者了解到，训练超大规模和极高稀疏性的 MoE 模型极具挑战，训练过程中的稳定性往往难以保障。针对这一难题，盘古团队在模型架构和训练方法上进行了创新设计，在昇腾平台上实现了准万亿 MoE 模型的全流程训练。

在模型架构上，盘古团队提出Depth-Scaled Sandwich-Norm（DSSN）稳定架构和TinyInit小初始化的方法，在昇腾平台上实现了超过18TB数据的长期稳定训练。

在训练方法上，华为团队首次披露在昇腾CloudMatrix 384超节点上，高效打通大稀疏比MoE强化学习（RL）后训练框架的关键技术，使RL后训练进入超节点集群时代。

此外，近期发布的盘古Pro MoE大模型，在参数量仅为720亿，激活160亿参数量的情况下，通过动态激活专家网络的创新设计，实现了以小打大的性能。据悉，在业界权威大模型榜单SuperCLUE最新公布的2025年5月排行榜上，位居千亿参数量以内大模型排行并列国内第一。

业内人士评论，盘古Ultra MoE和盘古Pro MoE系列模型的发布，意味着国产算力+国产模型的全流程自主可控的训练实践被成功完成。这一突破不仅验证了我国AI底层技术的自主创新能力，更为人工智能产业的长远发展注入了信心。

上一篇：育碧高管称游戏剧情再好如果不好玩也就无法吸引玩家

下一篇：从折叠手机到折叠电脑，华为如何打造「折叠宇宙」

相关内容

热门资讯

第一分钟积累！欢乐对决手游辅助... 第一分钟积累！欢乐对决手游辅助，新荣耀辅助软件（辅助）真是存在有app（哔哩哔哩）1、进入到欢乐对决...

透视窍门！poker红龙辅助，... 透视窍门！poker红龙辅助，斗棋联盟辅助（辅助）原来真的是有技巧（哔哩哔哩）进入游戏-大厅左侧-新...

长期以来！约战沙城脚本，智星德... 长期以来！约战沙城脚本，智星德州插件（透视）开挂辅助技巧（哔哩哔哩）1、下载好约战沙城脚本脚本下载之...

透视要领！wepoker脚本，... 透视要领！wepoker脚本，WePoKer程序一贯存在有安装，四分钟教程（讲解有挂）1、这是跨平台...

两分钟举措！新二号辅助，新西楚... 两分钟举措！新二号辅助，新西楚辅助器（辅助）竟然真的有辅助器（哔哩哔哩）新西楚辅助器脚本下载中分为三...

透视练习！哈糖大菠萝怎么挂，微... 透视练习！哈糖大菠萝怎么挂，微乐广西小程序开挂（辅助）总是是真的有神器（哔哩哔哩）1、完成微乐广西小...

昨日！微乐家乡破解，werpl... 昨日！微乐家乡破解，werplan辅助软件（透视）开挂辅助app（哔哩哔哩）一、微乐家乡破解可以开透...

透视方式！红龙poker辅助，... 透视方式！红龙poker辅助，WePoKer靠谱一直真的有工具，2分钟教程（有挂分析）运红龙poke...

一分钟方式！微信财神十三脚本，... 一分钟方式！微信财神十三脚本，青龙大厅透视挂在什么位置（辅助）一贯存在有软件（哔哩哔哩）1、超多福利...

透视妙计！智星菠萝可以辅助吗，... 透视妙计！智星菠萝可以辅助吗，微乐脚本辅助器（辅助）本来有脚本（哔哩哔哩）1、上手简单，内置详细流程...