来源:猎云网
5月20日,阿里云在峰会上宣布完成"芯片-云-模型-推理"全栈Agent化升级,同步推出全新AI产品官网"千问云"、搭载自研AI芯片真武M890的超节点服务器,以及最新旗舰模型Qwen3.7-Max。
这是国内云厂商首次围绕Agent进行全栈产品发布。阿里云资深副总裁刘伟光表示, Agent突破临界点之后可以24小时不间断工作,对AI和云的需求无穷无尽。阿里云正在进行全栈技术革新,从底层芯片、Agentic Cloud、模型到推理平台全面升级,建设中国最大的AI工厂。
更值得注意的信号来自资本市场,上周阿里财报披露,AI模型及应用服务ARR已超过80亿元,预计年底突破300亿元,消息发布当天阿里股价飙涨8%。这次激进升级之后,Agent驱动的MaaS收入将取代ECS成为阿里云最大的产品线——这意味着阿里云的增长引擎,正在全面切换为以Token为计量单位的AI收入。
这场变化有一个最直观的注脚:阿里云新推出的"千问云"官网,突出的不是产品列表,也不是控制台入口,只有一行Agent可读的代码指令,意思是“请安装千问云skills”。云的用户正在从人变成Agent,而阿里云决定让整套技术体系为此全面重构。
芯片:基于新一代真武芯片的超节点服务器
在芯片层,阿里云亮出了一张目前国内云厂商中独一份的牌——覆盖算力、网络、存储的完整自研数据中心芯片矩阵。
峰会上,阿里发布基于新一代AI芯片真武M890的磐久AL128超节点服务器,搭载自研互联芯片ICN Switch 1.0,可让128张AI芯片组成一台计算机,P2P时延低于150ns,主打解决Agent场景下的海量并发推理和大模型训练需求,目前已上线阿里云百炼,支持Qwen、DeepSeek、Kimi等主流模型。
平头哥新一代训推一体AI芯片真武M890首次亮相,规格相当硬核:144GB显存,片间互联带宽800GB/s,性能是上一代真武810E的3倍。
平头哥同时首次公布了真武系列芯片的路线规划:未来两年将陆续推出算力更强的真武V900、真武J900两代芯片。目前真武系列AI芯片累计出货56万片,已服务中国电信、中国一汽、浦发银行等20多个行业的400多家客户。
加上自研的倚天系列CPU、磐脉智能网卡、镇岳存储主控芯片、ICN Switch互联芯片,平头哥的芯片版图已经从"单点突破"走到了"全面覆盖"。
平头哥半导体副总裁高慧表示,Agentic时代,一个Agent在执行任务时可能在毫秒间连续发起数十次模型调用,同时需要CPU、GPU、网络和存储等核心部件紧密协同。平头哥构建全栈自研芯片矩阵,核心就是希望实现算力、网力、存力的系统级协同,让每一个Agent都能流畅、稳定运行。
全面迈入Agentic Cloud
阿里云还在做一件更底层的事:把云产品本身变成Agent能用的东西。传统云产品的设计逻辑是面向人的:打开控制台,看到一堆菜单、配置项、仪表盘,这些视觉化的信息对人很友好,但对Agent毫无意义。
为此,阿里云对云产品进行了Skill化、MCP化和CLI化改造,让每一个云产品都变成Agent可以"像调函数一样调用"的标准化能力模块。
阿里云首席技术官李飞飞认为,传统云产品的交互逻辑是为人设计的——用户看着控制台点击按钮,或者通过API编写代码调用。但Agent工作负载是“无规律弹性、短生命周期、瞬时起量即走”,与传统云计算的稳态负载截然不同。
对此,阿里云为Agent构建了完整的运行环境支撑,提供轻量高效的沙箱执行环境、多Agent协同能力、跨任务的记忆能力、顺畅的数据流转通路,以及全域智能运维能力。
Qwen3.7-Max国产第一,胜任35小时长程任务
Qwen3.7-Max是阿里巴巴最新发布的旗舰大模型。在三方机构Arena全球大模型盲测总榜中,Qwen3.7-Max超过Kimi-K2.6、DeepSeek-v4-pro、GLM-5.1,与GPT、Claude、Gemini最强模型接近,位列国产模型第一。
但比跑分更有说服力的是一个实战案例:在训练时从未接触过的真武M890芯片上,Qwen3.7-Max仅凭一份任务说明,从零开始自主工作35小时,独立完成了一个生产级AI计算内核的编写与调优,最终性能较官方版本提升10倍。
没有人类干预,没有中间指导,35小时,从零到生产级。这个案例的示范意义在于:它展示的不是模型"回答问题"的能力,而是模型"自主完成复杂工程任务"的能力——这恰恰是Agent场景最核心的需求。
阿里巴巴通义大模型事业部负责人周靖人表示:“大模型正在经历一次核心范式转移——从对齐人类偏好,到对齐任务目标。过去我们追求的是模型'说得好',现在要求模型'做得到'。Qwen3.7-Max的设计初衷,就是让模型真正成为Agent的智能内核,具备自主规划、持续迭代、跨工具协作的能力。”
值得注意的是,近3个月内千问旗舰模型已经连续迭代了3.5、3.6、3.7三个版本,保持着极高的发布节奏。阿里巴巴显然在刻意加速模型进化,以匹配Agent时代对模型能力的指数级增长需求。
百炼推理平台实现极致弹性
如果说芯片是地基、模型是引擎,那百炼推理平台就是Agent真正跑起来的"生产车间"。
阿里云在百炼平台上构建了大规模GPU资源集群,并通过一套完整的技术栈来应对Agent场景的特殊挑战:
●并池调度:将GPU资源统一调度,提升整体利用率;
●上下文缓存:消除Agent在多轮对话和长链路任务中的重复计算开销;
●吞吐弹性调度:应对Agent并发请求的波峰波谷,确保在流量激增时不崩溃、在低谷期不浪费;
●Agentic RL:基于Agent实际执行反馈的强化学习机制,让模型在真实场景中越用越好,持续迭代。
此外,百炼内建了安全治理能力。这一点容易被忽略,但在Agent自主运行的语境下极其关键——一个24小时不间断执行任务的Agent,如果没有边界约束,后果不可控。百炼的安全机制确保Agent始终在预设的权限范围内行动。
在生态策略上,百炼保持开放接入。除了阿里自研的千问模型矩阵,平台还将接入智谱GLM-5.1、MiniMax M2.7、月之暗面Kimi K2.6、可灵、Vidu Q3等第三方模型。
千问云:Agentic时代的新入口
千问云(www.qianwenai.com)是阿里云成立17年来,首次在阿里云官网之外推出的全新产品官网。
打开页面,突出的不是产品列表,也不是控制台,没有任何传统意义上的导航结构。首页只有一行字:安装Skills npx skills add QianWen-AI/qianwen-ai
这是一条Agent可读的prompt指令。阿里云将所有模型服务的核心能力封装为标准化的Skills和CLI工具,智能体可以直接解析这条指令,"学会"网站的全部能力,并根据需求自主调用。
过去十年,云的交互逻辑是"人登录控制台→选产品→配参数→调API"。这套流程对人类来说已经足够顺畅,但对Agent来说完全不可用。Agent不看网页,不点按钮,它需要的是结构化的能力描述、明确的调用协议和可预期的反馈机制。阿里云同步推出了Skills门户,将常用云功能统一封装为可被Agent直接调用的标准化模块,用户仅需一句自然语言指令,Agent即可完成从资源识别到应用部署的全流程。
上一次中国头部科技公司以如此决绝的方式重构产品入口,可能要追溯到移动互联网早期,当所有人把PC官网的流量让位给App的那个阶段。只不过这一次更彻底:App至少还需要人去打开,而Agent只需要"读"一条指令。
阿里云用一行代码替代了整个官网,这是对未来用户形态的一次押注——当云的主要消费者不再是人,而是Agent,所有围绕人类设计的界面、流程和交互逻辑,都将被重写。