谁在定义智算时代的“极致”与“极限”?
创始人
2025-05-27 09:42:01
0

从蒸汽机到电力革命,从互联网到移动互联网,每一次产业变革都遵循“技术触发到场景适配,再到行业繁荣”的铁律,唯有AI时代是跳跃式的发展。

凯文·凯利早就在《必然》中预言未来三十年,人类社会将经历比工业革命更剧烈的技术跃迁,但连这位预言家本人,都未曾料到大模型会让AI时代的进化速度如此迅猛。

年初DeepSeek横空出世,以开源的形态迅速席卷全球,并形成了一种事实性的标准。大量企业为其趋之若鹜,几个月的时间里,数不胜数的AI应用快速的部署和落地,因此也产生了许多“断层”,特别是那一道巨大的算力“鸿沟”。

我们知道,传统算力每18-20个月翻一倍,在深度学习的时候,每6个月翻一倍,而到了大模型时代算力几乎是每年几十倍的增长。IDC的数据也显示:全球算力需求将以每年50%的速度增长,而AI应用驱动算力需求增长速度更快,预计到2030年,智能算力需求将比当前呈现上百倍的增长。

当算力的鸿沟正在被越拉越大,摆在我们眼前的其实有两条路线:要么强化计算单机设备性能,突破现有的算力“极限”;要么通过异构智算技术,让存量算力的效率达到“极致”。

那么,在“极限”和“极致”这两条路上,谁又能代表中国的算力创新?

算力鸿沟的破局之道,极限与极致的双向突围

不可否认,DeepSeek横空出世,为智算领域带来了全新的质变。

按照“杰文斯悖论”:技术进步本应降低资源消耗,却因效率提升催生了更强烈的需求。以DeepSeek为例,其模型训练成本较三年前下降85%,算力需求弹性扩大6倍。算力成本结构的剧变,使得AI技术逐步转变为所有企业均可负担的基础设施。

如联想集团副总裁、中国基础设施业务群总经理陈振宽所说,“过去,AI算力的使用者主要集中在以基础大模型开发为核心的少数用户;而今年,以DeepSeek、千问等为代表的大模型,以更强大的性能和更优化的成本,驱动更广泛的用户加入到AI应用落地的队伍之中。”

当AI技术加快向百行百业渗透,必定会刺激智算需求呈现几何级数的增长。供需力量共同推动了算力需求规模的持续增长,根据IDC预测,2025年中国X86服务器市场仍将保持12%的稳健增长,而AI服务器的增速则将保持在30%以上。

当然,智算的需求发展,并非尽在数量级上,而是有了很多新的要求和“内容”。

以DeepSeek为例,千亿级参数规模的训练需要万卡级GPU集群连续运转数周,而推理阶段同样需要高性能计算资源来保证低延迟响应。同时,AI应用场景变得更加多元化,从智能客服、医疗诊断到自动驾驶、工业质检,这使得算力需求不再局限于云端超算中心,而是向边缘计算、企业本地化部署快速延伸。

这些变化催生了两个趋势:一是超大规模算力集群需要更高的“算-存-网”协同效率,二是轻量化推理设备必须提供更强的单机性能。

这也与陈振宽的判断不谋而合,“作为AI时代的能力底座,算力技术也在不断升级。万卡、十万卡级算力集群的出现,要求在超大规模算力集群里,实现‘算存网’能力的高效协同;而模型本地部署的应用潮流,又带来对大模型一体机单机性能的极致要求;与此同时,液冷技术、异构计算等技术创新也在快速渗透;算力对AI时代发展的重要意义,正在持续增强。”陈振宽说。

因此,在突破性能“极限”方面,联想深度构建以计算力、存储力、运载力为核心的AI基础设施,打造覆盖AI全场景、性能领先的AI算力产品组合。

而在追求算力效率“极致”方面,联想将万全异构智算平台升级到3.0版本,以及AI推理加速算法集、AI编译优化器、AI训推慢节点故障预测与自愈系统、专家并行通信算法四大技术创新,为高效算力提供强大支撑。

这两条路径,到底要怎么走?

“万全”之策,从平台到场景的技术闭环

以DeepSeek为代表的开源大模型迅速崛起,形成的AI普惠化趋势,本质上是带来了算力需求的结构性变化:从过去集中在预训练阶段的算力需求,正快速向推理和后训练环节延伸。

按照联想中国基础设施业务群战略管理部总监黄山的观察,“截至去年,AI算法的需求主要来源于基础大模型开发用户,他们的诉求主要是算力利用率的提升,而今年以DeepSeek为代表的开源大模型让数以万计的用户加入到了AI应用开序列,产生了大量对AI推理和后训练算力的强烈需求。”

这种需求的跃迁直接催生了更复杂、更多元的算力需求:既要支持千卡级集群的高效训练,又要满足企业本地化部署的极致推理性能,还要确保分布式计算的高可用性。这其实是联想升级万全异构智算平台3.0的主要动因。

而更深层次的原因,则源自当前大模型落地面临三个核心矛盾:

首先是算力效率瓶颈,传统AI集群的模型浮点利用率(MFU)普遍低于40%,意味着超过一半的算力资源被闲置或浪费;其次是推理性能天花板,单台服务器承载的并发请求量难以突破千级门槛;最棘手的是分布式系统的稳定性问题,在千卡级训练中,任何一个GPU的轻微故障都可能导致整个集群效率腰斩。

而万全异构智算平台3.0的技术创新直击这些痛点:

AI推理加速算法集,通过对MMA等新型方法工程实践并结合自身混合精度量化等方法二次优化,满足用户对推理更高吞吐量、更低延时诉求,可将DeepSeek等大模型推理性能提升5-10倍。

AI编译优化器,采用临近算子融合等方式简化计算过程,结合与GPU战略伙伴成果优化算子,使AI训练和推理计算开销降低至少15%。

AI训推慢节点故障预测与自愈系统,基于三年以上实践积累的故障特征库和训练的故障预测模型,实现百卡秒级、千卡分钟级、万卡十分钟级故障自愈。

专家并行通信算法,针对MoE架构大模型训推通信问题,在底层核函数层面实现计算与通信高度并行,将推理延迟降低3倍以上,网络带宽利用率从50%提升到90%。

事实上,万全平台的升级是瞄准了客户场景的真实需求,所以在行业实践方面也是成果显著,比如在东数西算第一大智算枢纽的千卡训练场景中,将MFU从30%提升至60%;在北京大学的生命科学AI计算大装置中,提升了异构GPU、NPU的计算效率;在吉利汽车超智融合计算集群中,纳管数万核算力并支持15类以上仿真预测应用;针对模型本地部署的企业AI基础设施场景,全速运转满血版DeepSeek R1 模型极限吞吐量超12,000Tokens/s,不断刷新性能的“极致”。

这样的“万全”才是行业发展的风向标,才是AI普惠化时代最稀缺的基础设施特质。

面向全面AI新场景,“一横五纵”重构智算体系

IDC最新预测显示,到2029年中国加速计算市场规模将突破千亿美元,其中70%的服务器需求将来自AI负载,这种结构性转变正重塑整个服务器产业的演进方向。

大模型训练从集中式走向分布式,推理场景从云端下沉到边缘,能耗问题从次要考量变为关键瓶颈……这一系列的变化,让企业从追求单纯的算力规模,向追求高效、稳定、绿色算力系统转变。

面对AI浪潮下带来的全新算力发展趋势下,联想坚持“一横五纵”的部署,在全新推出了联想万全异构智算平台3.0之后,在自身算力全产品线上也开启了“满天星”模式的全面升级。从而在AI新场景下不断涌现的形势下,重构全新智算体系,并持续引领着行业发展。

恰如联想中国基础设施业务群服务器产品部总经理周韬所言,“客户整个转化链条对算力的需求已超越单一硬件维度,而是涵盖数据处理、AI训练、推理应用的全栈算力解决方案。”

联想敏锐洞察到这些趋势与需求,针对数据处理场景,联想新一代数据处理服务器在单一机柜中可实现多达48个计算节点,配置12288个英特尔®志强®6性能核心,并搭配8800MHz MRDIMM内存,大幅提升生成式人工智能性能。配合专利无滴漏不锈钢盲插系统与航空级防松连接装置,构建出全液冷高密度计算平台。

在模型训练和优化场景,联想推出一系列AI训练算力服务器。配置两颗英特尔®志强®处理器与8块GPU卡,通过OAM互联输出强大算力。面对GPU和CPU功耗不断提升的问题,联想采用冷板式CPU/GPU液冷方案,为600瓦以上处理器提供浸没式液冷技术,助力AI训练服务器家族实现绿色节能。

在推理应用场景,联想最新的推理应用算力服务器支持英特尔®至强®6处理器和主流 PCIE GPU处理器,每个CPU核集成英特尔AMX BF16和IP16加速器,与GPU配合默契,甚至可直接调用CPU算力完成小规模推理业务。同时提供 CPU、GPU、内存VR全液冷方案,结合处理器的能效比,可以为客户带来2倍性能与4倍性能功耗比。

实际上,这些技术升级,都是基于联想AI导向的基础设施“一横五纵”的布局战略。“一横”的不断提升,也同步伴随着“五纵”全线产品组合的能力升级。

计算力层面,针对AI训练场景,推出联想问天 WA7880a家族等算力利器;数据处理环节,联想ThinkSystem SC750 V4服务器高效支撑;推理应用领域,联想问天WA5480 G5、联想问天WR5220 G5,以及联想ThinkSystem SR650 V4、SR650a V4、SR630 V4等服务器,共同构建了强大的算力组合。

在存储力层面,从联想问天DXN AI 存储解决方案、DXN2000系列、DXN 全闪系列,到Lenovo ThinkSystem DE/DM/DG系列、NetApp ASA/AFF/FAS系列,再到AIPod DeepSeek一体机,面向全场景支持产品能够快速落地、满足本地各行业实际需求。

在运载力层面,联想凭借RoCE/IB多架构融合及低延迟优化技术,构建起适配不同规模AI算力集群的智能网络体系。最新发布的高密度400G交换机联想问天NE8770-64QC,专为AI场景深度定制。同期亮相的多业务核心交换机联想问天NE7550G-8C与新一代高性能核心交换机联想问天NE9770G-4C,也为数据网络性能提升注入强劲动力。

在软件及超融合领域,联想重磅升级AIO V6系列产品和联想问天WX系列虚拟化超融合8.0.2版本,进一步彰显了联想超融合产品的卓越实力。

在算力服务方面联想首次发布算力服务“成本-效能”双优运营系统,持续助力客户优化运营效能与成本。其中智能调度引擎与FinOps引擎,可提升集群资源利用率13%,并精准识别58%无效实例,最大化用户效益。

特别要指出,在绿色算力方面,联想以液冷技术为核心实现能效跃升:单相浸没“飞鱼”仿生散热技术,模拟鱼类游动姿态优化流体设计,支持下一代600W芯片散热,最大功耗提升20%;双循环相变浸没系统,散热能力较传统方案翻倍,系统PUE低至1.035,全球领先。

事实上,从联想万全异构智算平台3.0的升级和联想“五纵”产品在不同场景下的技术演进,我们更应该关注其背后所折射出来的发展趋势:

第一,算力供给从粗放走向精准,不再单纯追求峰值算力,而是强调每瓦特的实效输出;第二,技术栈从分离走向融合,需要同时优化计算、存储、网络的全栈效能;第三,应用场景从集中式走向分布式,既要支持东数西算级别的超算中心,也要赋能企业本地的轻量化部署。

我们认为,真正的算力革命并不完全取决于芯片,而在于让每一焦耳能量、每一毫米空间、每一秒时间都发挥极致价值,让每一分算力都能突破效率的“极限”。而这才是联想想要定义的智算时代。

相关内容

热门资讯

透视辅助!功夫川麻小程序辅助器... 透视辅助!功夫川麻小程序辅助器(辅助挂)切实有挂(详细辅助实用技巧)功夫川麻小程序辅助器辅助器中分为...
辅助透视!wpk透视辅助方法,... 辅助透视!wpk透视辅助方法,wpk辅助ai,教你教程(有挂插件)1、完成wpk透视辅助方法的残局,...
德普之星辅助正版!pokepl... 德普之星辅助正版!pokeplus脚本(透视)确实是有挂(安装教程)暗藏猫腻,小编详细说明pokep...
透视辅助!佛手十三道辅助工具(... 透视辅助!佛手十三道辅助工具(辅助挂)本来真的是有挂(详细辅助透明教程);1、进入到佛手十三道辅助工...
透视黑科技!德普之星app安卓... 透视黑科技!德普之星app安卓版破解版,hhpoker透视下载链接在哪里,2025新版(有挂详情)1...
aapoker透视脚本安装包!... aapoker透视脚本安装包!购买wepoker模拟器(透视)总是是真的有挂(攻略教程)1、下载好购...
透视辅助!德普之星辅助器(辅助... 透视辅助!德普之星辅助器(辅助挂)切实存在有挂(详细辅助微扑克教程)1、全新机制【德普之星辅助器软件...
透视数据!德普之星怎么作弊,w... 透视数据!德普之星怎么作弊,wpk辅助购买,解说技巧(有挂攻略);亲,关键说明,德普之星怎么作弊赛季...
aapkoer德州辅助挂下载!... aapkoer德州辅助挂下载!hhpoker软件可以玩吗(透视)切实有挂(教你攻略)1、该软件可以轻...
透视辅助!互游辅助(辅助挂)本... 透视辅助!互游辅助(辅助挂)本来是真的有挂(详细辅助黑科技教程)1、互游辅助系统规律教程、互游辅助辅...