可替代NVIDIA!摩尔线程GPU千卡集群完成30亿参数大模型实训
创始人
2024-05-27 11:40:58
0

快科技5月27日消息,摩尔线程、无问芯穹联合宣布,双方已经正式完成MT-infini-3B 3B(30亿参数)规模大模型的实训,基于摩尔线程国产全功能GPU MTT S4000组成的千卡集群,以及无问芯穹的AIStudio PaaS平台。

本次实训充分验证了夸娥千卡智算集群在大模型训练场景下的可靠性,同时也在行业内率先开启了国产大语言模型与国产GPU千卡智算集群深度合作的新范式。

据悉,这次的MT-infini-3B模型训练总共用时13.2天,全程稳定无中断,集群训练稳定性达到100%,千卡训练和单机相比扩展效率超过90%。

目前,实训出来的MT-infini-3B性能在同规模模型中跻身前列,相比在国际主流硬件上(尤其是NVIDIA)训练而成的其他模型,在C-Eval、MMLU、CMMLU等3个测试集上均实现性能领先。

无问芯穹正在打造“M种模型”和“N种芯片”之间的“M x N”中间层产品,实现多种大模型算法在多元芯片上的高效、统一部署,已与摩尔线程达成深度战略合作。

摩尔线程是第一家接入无问芯穹并进行千卡级别大模型训练的国产GPU公司,夸娥千卡集群已与无穹Infini-AI顺利完成系统级融合适配,完成LLama2 700亿参数大模型的训练测试。

T-infini-3B的训练,则是行业内首次实现基于国产GPU芯片从0到1的端到端大模型实训案例。

就在日前,基于摩尔线程的夸娥千卡集群,憨猴集团也成功完成了7B、34B、70B不同参数量级的大模型分布式训练,双方还达成战略合作。

经双方共同严苛测试,兼容适配程度高,训练效率达到预期,精度符合要求,整个训练过程持续稳定。

相关内容

热门资讯

银发餐饮:为何万亿市场,却难觅... 银发经济的餐饮蓝海:为何万亿市场,却难觅一个成功品牌? —— 藏在“三低”需求里的真金,为什么你挖不...
毕业了,团组织关系怎么办?(附... 又是一年毕业季 学业落幕、逐梦前行的同时 广大应届毕业学生团员 千万别忘了一件重要事项—— 团组织关...
预算300万元 中国科协招标制... 中国政府采购网发布招标公告,中国科协科学技术传播中心正式启动中华科技文明展(三)影片策划和制作项目采...
原创 金... “飞雪连天射白鹿,笑书神侠倚碧鸳”,只要你自诩武侠迷,就一定不会错过金庸的这十四部经典之作,哪怕这些...
豹猫在北京如何生活?记者探访西... 豹猫隶属于食肉目猫科豹猫属,是国家二级保护动物。很多人听到它的名字会以为它像豹子那么大,其实它的体形...
欧洲“重拾”核能,前景如何 近期,欧盟委员会主席冯德莱恩在今年的巴黎核能峰会上表示,欧洲过去几十年削弱核能地位是“战略性错误”,...
工信部:支持研发专业性高、落地... 央广网北京6月10日消息(记者 黄昂瑾)近日,工业和信息化部印发《“人工智能+信息通信”创新发展实施...
华通精密取得FPCA测试治具专... 国家知识产权局信息显示,华通精密线路板(惠州)股份有限公司取得一项名为“一种FPCA测试治具”的专利...
原创 红... 随着手游与应用不断升级,高配置、高性能的机型越来越多,比如红米K90系列、荣耀WIN系列、iQOO ...
科和盛业取得磁控溅射布气装置专... 国家知识产权局信息显示,深圳市科和盛业技术有限公司、东莞市科盛机电设备有限公司取得一项名为“一种磁控...