谁在定义智算时代的“极致”与“极限”？

创始人

2025-05-27 09:42:01

0次

从蒸汽机到电力革命，从互联网到移动互联网，每一次产业变革都遵循“技术触发到场景适配，再到行业繁荣”的铁律，唯有AI时代是跳跃式的发展。

凯文·凯利早就在《必然》中预言未来三十年，人类社会将经历比工业革命更剧烈的技术跃迁，但连这位预言家本人，都未曾料到大模型会让AI时代的进化速度如此迅猛。

年初DeepSeek横空出世，以开源的形态迅速席卷全球，并形成了一种事实性的标准。大量企业为其趋之若鹜，几个月的时间里，数不胜数的AI应用快速的部署和落地，因此也产生了许多“断层”，特别是那一道巨大的算力“鸿沟”。

我们知道，传统算力每18-20个月翻一倍，在深度学习的时候，每6个月翻一倍，而到了大模型时代算力几乎是每年几十倍的增长。IDC的数据也显示：全球算力需求将以每年50%的速度增长，而AI应用驱动算力需求增长速度更快，预计到2030年，智能算力需求将比当前呈现上百倍的增长。

当算力的鸿沟正在被越拉越大，摆在我们眼前的其实有两条路线：要么强化计算单机设备性能，突破现有的算力“极限”；要么通过异构智算技术，让存量算力的效率达到“极致”。

那么，在“极限”和“极致”这两条路上，谁又能代表中国的算力创新？

算力鸿沟的破局之道，极限与极致的双向突围

不可否认，DeepSeek横空出世，为智算领域带来了全新的质变。

按照“杰文斯悖论”：技术进步本应降低资源消耗，却因效率提升催生了更强烈的需求。以DeepSeek为例，其模型训练成本较三年前下降85%，算力需求弹性扩大6倍。算力成本结构的剧变，使得AI技术逐步转变为所有企业均可负担的基础设施。

如联想集团副总裁、中国基础设施业务群总经理陈振宽所说，“过去，AI算力的使用者主要集中在以基础大模型开发为核心的少数用户；而今年，以DeepSeek、千问等为代表的大模型，以更强大的性能和更优化的成本，驱动更广泛的用户加入到AI应用落地的队伍之中。”

当AI技术加快向百行百业渗透，必定会刺激智算需求呈现几何级数的增长。供需力量共同推动了算力需求规模的持续增长，根据IDC预测，2025年中国X86服务器市场仍将保持12%的稳健增长，而AI服务器的增速则将保持在30%以上。

当然，智算的需求发展，并非尽在数量级上，而是有了很多新的要求和“内容”。

以DeepSeek为例，千亿级参数规模的训练需要万卡级GPU集群连续运转数周，而推理阶段同样需要高性能计算资源来保证低延迟响应。同时，AI应用场景变得更加多元化，从智能客服、医疗诊断到自动驾驶、工业质检，这使得算力需求不再局限于云端超算中心，而是向边缘计算、企业本地化部署快速延伸。

这些变化催生了两个趋势：一是超大规模算力集群需要更高的“算-存-网”协同效率，二是轻量化推理设备必须提供更强的单机性能。

这也与陈振宽的判断不谋而合，“作为AI时代的能力底座，算力技术也在不断升级。万卡、十万卡级算力集群的出现，要求在超大规模算力集群里，实现‘算存网’能力的高效协同；而模型本地部署的应用潮流，又带来对大模型一体机单机性能的极致要求；与此同时，液冷技术、异构计算等技术创新也在快速渗透；算力对AI时代发展的重要意义，正在持续增强。”陈振宽说。

因此，在突破性能“极限”方面，联想深度构建以计算力、存储力、运载力为核心的AI基础设施，打造覆盖AI全场景、性能领先的AI算力产品组合。

而在追求算力效率“极致”方面，联想将万全异构智算平台升级到3.0版本，以及AI推理加速算法集、AI编译优化器、AI训推慢节点故障预测与自愈系统、专家并行通信算法四大技术创新，为高效算力提供强大支撑。

这两条路径，到底要怎么走？

“万全”之策，从平台到场景的技术闭环

以DeepSeek为代表的开源大模型迅速崛起，形成的AI普惠化趋势，本质上是带来了算力需求的结构性变化：从过去集中在预训练阶段的算力需求，正快速向推理和后训练环节延伸。

按照联想中国基础设施业务群战略管理部总监黄山的观察，“截至去年，AI算法的需求主要来源于基础大模型开发用户，他们的诉求主要是算力利用率的提升，而今年以DeepSeek为代表的开源大模型让数以万计的用户加入到了AI应用开序列，产生了大量对AI推理和后训练算力的强烈需求。”

这种需求的跃迁直接催生了更复杂、更多元的算力需求：既要支持千卡级集群的高效训练，又要满足企业本地化部署的极致推理性能，还要确保分布式计算的高可用性。这其实是联想升级万全异构智算平台3.0的主要动因。

而更深层次的原因，则源自当前大模型落地面临三个核心矛盾：

首先是算力效率瓶颈，传统AI集群的模型浮点利用率（MFU）普遍低于40%，意味着超过一半的算力资源被闲置或浪费；其次是推理性能天花板，单台服务器承载的并发请求量难以突破千级门槛；最棘手的是分布式系统的稳定性问题，在千卡级训练中，任何一个GPU的轻微故障都可能导致整个集群效率腰斩。

而万全异构智算平台3.0的技术创新直击这些痛点：

AI推理加速算法集，通过对MMA等新型方法工程实践并结合自身混合精度量化等方法二次优化，满足用户对推理更高吞吐量、更低延时诉求，可将DeepSeek等大模型推理性能提升5-10倍。

AI编译优化器，采用临近算子融合等方式简化计算过程，结合与GPU战略伙伴成果优化算子，使AI训练和推理计算开销降低至少15%。

AI训推慢节点故障预测与自愈系统，基于三年以上实践积累的故障特征库和训练的故障预测模型，实现百卡秒级、千卡分钟级、万卡十分钟级故障自愈。

专家并行通信算法，针对MoE架构大模型训推通信问题，在底层核函数层面实现计算与通信高度并行，将推理延迟降低3倍以上，网络带宽利用率从50%提升到90%。

事实上，万全平台的升级是瞄准了客户场景的真实需求，所以在行业实践方面也是成果显著，比如在东数西算第一大智算枢纽的千卡训练场景中，将MFU从30%提升至60%；在北京大学的生命科学AI计算大装置中，提升了异构GPU、NPU的计算效率；在吉利汽车超智融合计算集群中，纳管数万核算力并支持15类以上仿真预测应用；针对模型本地部署的企业AI基础设施场景，全速运转满血版DeepSeek R1 模型极限吞吐量超12,000Tokens/s，不断刷新性能的“极致”。

这样的“万全”才是行业发展的风向标，才是AI普惠化时代最稀缺的基础设施特质。

面向全面AI新场景，“一横五纵”重构智算体系

IDC最新预测显示，到2029年中国加速计算市场规模将突破千亿美元，其中70%的服务器需求将来自AI负载，这种结构性转变正重塑整个服务器产业的演进方向。

大模型训练从集中式走向分布式，推理场景从云端下沉到边缘，能耗问题从次要考量变为关键瓶颈……这一系列的变化，让企业从追求单纯的算力规模，向追求高效、稳定、绿色算力系统转变。

面对AI浪潮下带来的全新算力发展趋势下，联想坚持“一横五纵”的部署，在全新推出了联想万全异构智算平台3.0之后，在自身算力全产品线上也开启了“满天星”模式的全面升级。从而在AI新场景下不断涌现的形势下，重构全新智算体系，并持续引领着行业发展。

恰如联想中国基础设施业务群服务器产品部总经理周韬所言，“客户整个转化链条对算力的需求已超越单一硬件维度，而是涵盖数据处理、AI训练、推理应用的全栈算力解决方案。”

联想敏锐洞察到这些趋势与需求，针对数据处理场景，联想新一代数据处理服务器在单一机柜中可实现多达48个计算节点，配置12288个英特尔®志强®6性能核心，并搭配8800MHz MRDIMM内存，大幅提升生成式人工智能性能。配合专利无滴漏不锈钢盲插系统与航空级防松连接装置，构建出全液冷高密度计算平台。

在模型训练和优化场景，联想推出一系列AI训练算力服务器。配置两颗英特尔®志强®处理器与8块GPU卡，通过OAM互联输出强大算力。面对GPU和CPU功耗不断提升的问题，联想采用冷板式CPU/GPU液冷方案，为600瓦以上处理器提供浸没式液冷技术，助力AI训练服务器家族实现绿色节能。

在推理应用场景，联想最新的推理应用算力服务器支持英特尔®至强®6处理器和主流 PCIE GPU处理器，每个CPU核集成英特尔AMX BF16和IP16加速器，与GPU配合默契，甚至可直接调用CPU算力完成小规模推理业务。同时提供 CPU、GPU、内存VR全液冷方案，结合处理器的能效比，可以为客户带来2倍性能与4倍性能功耗比。

实际上，这些技术升级，都是基于联想AI导向的基础设施“一横五纵”的布局战略。“一横”的不断提升，也同步伴随着“五纵”全线产品组合的能力升级。

在计算力层面，针对AI训练场景，推出联想问天 WA7880a家族等算力利器；数据处理环节，联想ThinkSystem SC750 V4服务器高效支撑；推理应用领域，联想问天WA5480 G5、联想问天WR5220 G5，以及联想ThinkSystem SR650 V4、SR650a V4、SR630 V4等服务器，共同构建了强大的算力组合。

在存储力层面，从联想问天DXN AI 存储解决方案、DXN2000系列、DXN 全闪系列，到Lenovo ThinkSystem DE/DM/DG系列、NetApp ASA/AFF/FAS系列，再到AIPod DeepSeek一体机，面向全场景支持产品能够快速落地、满足本地各行业实际需求。

在运载力层面，联想凭借RoCE/IB多架构融合及低延迟优化技术，构建起适配不同规模AI算力集群的智能网络体系。最新发布的高密度400G交换机联想问天NE8770-64QC，专为AI场景深度定制。同期亮相的多业务核心交换机联想问天NE7550G-8C与新一代高性能核心交换机联想问天NE9770G-4C，也为数据网络性能提升注入强劲动力。

在软件及超融合领域，联想重磅升级AIO V6系列产品和联想问天WX系列虚拟化超融合8.0.2版本，进一步彰显了联想超融合产品的卓越实力。

在算力服务方面联想首次发布算力服务“成本-效能”双优运营系统，持续助力客户优化运营效能与成本。其中智能调度引擎与FinOps引擎，可提升集群资源利用率13%，并精准识别58%无效实例，最大化用户效益。

特别要指出，在绿色算力方面，联想以液冷技术为核心实现能效跃升：单相浸没“飞鱼”仿生散热技术，模拟鱼类游动姿态优化流体设计，支持下一代600W芯片散热，最大功耗提升20%；双循环相变浸没系统，散热能力较传统方案翻倍，系统PUE低至1.035，全球领先。

事实上，从联想万全异构智算平台3.0的升级和联想“五纵”产品在不同场景下的技术演进，我们更应该关注其背后所折射出来的发展趋势：

第一，算力供给从粗放走向精准，不再单纯追求峰值算力，而是强调每瓦特的实效输出；第二，技术栈从分离走向融合，需要同时优化计算、存储、网络的全栈效能；第三，应用场景从集中式走向分布式，既要支持东数西算级别的超算中心，也要赋能企业本地的轻量化部署。

我们认为，真正的算力革命并不完全取决于芯片，而在于让每一焦耳能量、每一毫米空间、每一秒时间都发挥极致价值，让每一分算力都能突破效率的“极限”。而这才是联想想要定义的智算时代。

上一篇：一分钟了解！微乐家乡麻将助赢神器，德扑胜率计算的软件，详细教程（有挂教学）-哔哩哔哩

下一篇：高安全等级飞控与显示系统供应商庆为航空完成数千万元天使轮融资

谁在定义智算时代的“极致”与“极限”？

算力鸿沟的破局之道，极限与极致的双向突围

“万全”之策，从平台到场景的技术闭环

面向全面AI新场景，“一横五纵”重构智算体系

相关内容

热门资讯