至顶AI实验室硬核评测:阿里云无影个人云超算「上手记」
创始人
2026-02-10 18:42:52
0

作者 | 周雅

评测 | 至顶AI实验室

来源 | 科技行者

过去大半年,我们一直在做端侧AI算力的评测。从英伟达DGX Spark,到各家厂商的桌面AI超算,跑模型推理、测ComfyUI工作流、试各种AIGC场景。这些产品各有亮点,但测得越多,越能看清一个事实:端侧硬件很强,但并非所有人、所有阶段都适合直接「买一台」来解决问题。

比如你是一个入门级AI开发者,今天的需求只是跑一个7B参数的小模型,但几个月后你也许会想试试70B甚至更大的模型。根源是,算力需求逐级爬升,一步到位买顶配,前期利用率很低,因为你还没入门;先买个够用的,过不了多久又面临升级,因为你已经入门——这个节奏很难踩准

再比如一个逐渐普遍的现实:你的角色可能不止一种

这两年有个概念,叫做OPC(One Person Company),是指一个人借助AI工具,可以干传统一整个小团队的活,成为超级个体。似乎听起来很美,但它对算力的要求同样也是“一个人顶一个团队”。上午你是AI开发者,在调模型写代码;下午变成内容创作者,做AI漫剧;晚上可能还想玩一把《黑神话:悟空》放松。每个角色吃的算力完全不同,一台固定配置的机器,很难同时喂饱所有场景。

Gartner曾做过一个预测:在未来5到10年内,DaaS(桌面即服务)将成为主流,云电脑或将成为企业与组织首选的办公计算机。它背后的逻辑,其实是算力供给模式的变革——当摩尔定律的边际效应递减,而AI模型的参数量却在以摩尔定律几倍的速度膨胀时,算力必然向云端迁移。

这就是我们开始关注云端桌面AI的原因,为此我们还在朋友圈玩起了梗,话题叫做#

最近,我们又拿到了一台——阿里云无影个人云超算。准确说,是在线上“开通”了一台云端的电脑,我们体验了一周,写了这篇上手记。

可以塞进衣服口袋的个人超算

阿里云无影,简单来说,这是一款可以随时随地接入的云上电脑。它最大的特点是实现了「算力与终端的彻底解耦」,这种解耦带来了极大便利性。在我们的实际体验中,无论手头上用的是MacBook,还是Windows笔电,甚至是一台 iPad,只要装了无影客户端App,就能瞬间接入同一个云端桌面。

2020年,阿里云展示了第一代无影云电脑,它的终端是一个名片夹大小的C-Key,连接显示屏就能进入云端桌面。当时这个品类还需要反复解释,很多人把它和远程桌面画等号。四年后的2024年,无影个人版亮相,个人玩家能直接跑《黑神话:悟空》,1080P下帧率稳定在60帧。

到了CES 2026,桌面AI超算成了几乎所有PC厂商的标配,惠普把AI PC塞进了键盘里,联想让笔记本屏幕自动旋转跟踪人脸,一大批厂商基于DGX Spark推出了巴掌大的本地AI超算。在这个舞台上,连续第二年参展的阿里云作为云厂商,就拿出了无影个人云超算。

单看起来,它是一个终端硬件,叫「无影魔方ultra」,巴掌大小,比一本精装书还轻,有点像一个接口丰富的“瘦客户机”,塞进口袋也毫不费力。

但别被尺寸骗了,它背后连着的云端配置是这样的:两块RTX 5880(单卡48GB显存,Ada Lovelace架构专业级显卡)、64核vCPU,总共96GB GPU显存。

96GB 显存是什么概念?市面上顶级的消费级显卡RTX 5090也才32G显存,96GB是它的三倍,意味着你可以轻松加载100B以上参数大模型做推理,或者跑视频生成任务也不成问题,不用担心爆显存。在本地,要搭建这样一套硬件环境,成本至少要三万元以上。而在无影上,这种巨大的前期投入被消解了,它变成列表里的一个图标,躺在屏幕里任我支配,让曾经遥不可及的超级算力变得触手可及。

魔方本身不做任何计算,所有算力都在云端,可以理解为一个「无限算力的水龙头」:插上电源、连上屏幕、就能打开云端那台超级电脑、源源不断流出更高的性能。

这是因为我们开通的是双卡配置,顶配还可以选择4块RTX 5880(合计192GB GPU显存)、96核服务器级CPU、384GB内存,这个性能参数放到大部分场景下应该都够用。

传统个人电脑是一锤子买卖,而无影的算力是弹性的,今天跑轻量任务用小规格,明天做模型训练一键切到顶配,数据通过无影存储中心无缝同步,切换过程不丢进度。

打开后台,我们可以通过「镜像管理」,分别为「云电脑」、「AI学习机」、「工作站」一键镜像多个系统,此次我们主要镜像了Windows、Linux Ubuntu、Kylin三种不同的系统进行测试。

此外,左侧列表中的「无影内容广场」,就像是一个“AI超市”,这里有大量的第三方共享镜像。想做图?选“ComfyUI-含主流模型和节点”镜像。想炼丹?选“AI-Toolkit LoRA训练”镜像。想跑模型推理或搞开发?PyTorch、TensorFlow基础框架一应俱全。甚至还有ModelScope(魔搭社区)、DiffSynth-Studio等阿里达摩院的独家生态镜像。

光看参数只是纸上谈兵,真正的考验在于实战,我们决定抛弃常规的办公场景评测,直接上强度。

实测:把96GB显存“榨干”

用目前AI圈最主流、同时也最消耗显存的ComfyUI视频生成工作流来进行极限压测,运行阿里开源的Wan 2.2 14B(万相)视频生成模型,这是一个对显存要求极高的任务,尤其是14B参数,在普通家用显卡上几乎无法全血运行。值得一提的是,wan2.2是目前最流行的开源视频大模型,没有之一,在开源领域的占比在40%以上。

我们设定了一个简单明了的提示词“马在行走,丝带飘动,表情灵动(A horse walking, ribbons flowing, vivid expression)”,分辨率设定为1280×720,开启FP8矩阵乘法优化和FLOW流匹配架构,后台日志开始飞速滚动。

模型加载阶段,即便使用了FP8量化优化,光是模型权重就占用了13629MB,将近13.6G显存。如果加上推理过程中的中间变量(KV Cache),24G显存的本地显卡不仅捉襟见肘,甚至直接爆显存。

但在无影上,日志显示当前可用显存28969MB。对于96G的总池子来说,这就像一条大河流过一个小水坝,毫无压力。

生成速度方面,核心采样过程耗时1分20秒,从点击开始到视频生成完毕,总耗时3分34秒。日志里还有一行“lowvram patches: 357”,这是针对低显存环境的自动优化补丁。对96G来说这几乎是多余的,但也说明无影在软件层面的兼容性做得足够细致。

我们至顶AI实验室的小伙伴实测,很明显的两个感受是:快、方便,因为可以直接把ComfyUI配置到自己电脑的Chrome浏览器上使用,可以理解为在你的浏览器上直接挂着ComfyUI。

更值得说的是,镜像市场里预配好的ComfyUI环境。两卡96G显存可以同时加载多个大模型和LoRA权重,不需要反复卸载和重装。这对做AI漫剧的创作者来说尤其关键。一条漫剧工作流往往要串联角色一致性模型、背景生成模型、表情控制LoRA,再接上Wan 2.2做动态视频片段,在24G显存的本地显卡上,光是模型切换就要反复腾挪,96G则可以全部常驻,专心调参出活。对于靠短视频批量生产吃饭的创作者来说,这直接决定了产能,让高端的生产力工具变得平易近人。

当然了,工作之余,这台“怪兽”能不能用来放松?

切换到云电脑模式,无影的内容广场里预置了《黑神话:悟空》、《鸣潮》、《我的世界》、《永劫无间》等15款热门游戏大作,可能之后还会上线更多游戏。

不过,当我进入其中某款游戏,登陆相关账号之后,也能直接通过账号入口登陆更多游戏。

时延,是云游戏最敏感的指标之一。根据官方给出的网络建议,要获得1080p、30fps的流畅基础体验,需要保证15Mbps以上的带宽,网络延迟低于60ms。而若要追求1080p、60fps的电竞级高帧率丝滑体验,带宽门槛则提升至25Mbps,延迟可以达到30ms以内。

这次实测下来,玩《鸣潮》这类动作游戏时操作跟手度极高,延迟基本稳定在16ms上下浮动,几乎感觉不到是在云端。在《我的世界》这种对加载速度要求较高的游戏中,大部分时间也非常流畅,只有极少数复杂场景下,时延会短暂波动到60ms左右,也不影响操作。

前面一直在用无影客户端做测试,但其实无影魔方ultra也支持多端接入,也就是说,当你只带了那一块盒子的情况下,任何一块屏幕也都能成为入口。

这在游戏场景下特别有意思:我在办公室用MacBook玩,回家路上用iPad接着玩,存档和进度无缝衔接。这也就说明,当算力在云端、延迟足够低的时候,你手里那台设备是什么品牌、什么配置,已经不重要了。屏幕就是全部。

尤其用Mac客户端接入的时候,有个细节让我印象很深:本地Mac和云端无影之间可以直接拖拽文件,操作感觉就像在同一台电脑的两个文件夹之间挪东西,用着用着会产生一种错觉,你的MacBook好像突然多长出了几块RTX 5880显卡。

还记得前面说的OPC吗?超级个体的一天可以是这样的:上午用容器模式调模型写代码,下午切到Windows环境做AIGC内容创作,晚上打开云游戏放松。一台固定配置的物理主机很难照顾到每个角色,但在无影上,切换身份就像切换频道。

更进一步而言,超级算力不再是少数专业人士或机构的专属品,而是一个能陪伴用户从好奇、探索到精通的成长伙伴。

算好经济账

性能说完,必须聊钱。无影的核心优势之一,就是将一次性的高昂硬件投资,转化为极致可控的按需付费服务,它采用了一目了然的「核时」计费模式。

根据实测后台数据,「开机」状态下,无论是云电脑还是容器,平均消耗150.82核时/小时「关机」状态下,云电脑消耗0.06核时/小时,容器消耗0.04核时/小时

这里有个容易被忽略的细节,如果不手动点击「关机」,后台会持续运行,会持续消耗核时。阿里云架构师告诉我们,无影的设计逻辑是:如果没有手动点击「关机」,系统会默认你可能在后台跑长任务(比如训练模型),它实则是在7*24小时工作状态。想想也合理:你花了几周配置好的炼丹环境,肯定不希望关机一次就全部清空,这些核时买的是数据安全存储和下一次启动的便利。

此外友情提醒,即便你手动点击了「关机」,后台依然会消耗极低的存储费(即上面的0.04-0.06核时),因为你的数据(硬盘、镜像、环境配置)依然占用着云端资源。下图可见,夜间时段也在消耗核时。不过换算下来,关机状态下,24小时消耗的核时总共几毛钱。如果确定不用,点击「销毁」即可。

具体花费怎么算?根据阿里云官方的说法,即便是4卡RTX 5880顶配(192GB显存),每月按量付费也仅在1000元左右。我们手上这台双卡配置,每天高强度用8小时,其余时间关机的话,月费大约500-600元

但两者设计思路完全不同DGX Spark走本地化路线,一次买断,性能固定,胜在离线可用、数据不出本机;无影走云端弹性路线,按需取用,随时升降,胜在配置天花板高、无硬件折旧。

我们也注意到,在一些公开测评中,无影顶配的综合跑分可以达到DGX Spark的数倍,而月费远低于后者的一次性购入成本。当然,两款产品面向的场景和取舍不同,直接比价未必公平。

比超级电脑多走一步

如果只是把传统PC的算力搬到了云上,无影充其量是“更方便的高性能电脑”,但无影的另一个拳头产品AgentBay,则暗示了一个更大的野心。

AgentBay是无影为AI Agent(智能体)打造的云端基础设施。通俗来说,它让AI助手获得了“手和脚”,AI不再只是坐在聊天框里回答问题,而是可以在云端沙箱里操作浏览器、控制桌面应用、执行代码、甚至操控手机界面。所有操作都在安全隔离的环境中独立运行,不影响用户自己的设备。

想象一个场景:你对AI说“帮我从这五个PDF里提取关键数据,整理成Excel,然后发邮件给团队”。过去,AI只能帮你写出提取脚本,剩下的你自己动手。有了AgentBay,AI可以在云端打开一台完整的电脑,自己操作浏览器下载文件、打开Office处理数据、登录邮箱发送,全程不需要你介入。

是不是很像最近爆火的clawdbot?没错,Agentbay也增加了内置Clawdbot模式,同时还拥有Clawdbot不具备的browser use能力和企业多Clawdbot部署能力。

这就是为什么我们在文章标题里用了「隐身」这个词。无影追求的终极形态,不是让你感觉在使用一台更强的电脑,而是让「电脑」这个概念本身逐渐消失,你只需要说出想做的事,算力、软件、环境、执行,一切在看不见的地方自动发生。

这次上手最让我印象深刻的,不是某个具体的跑分数字或者启动速度,而是一种错位感,手里握着一个比充电宝大不了多少的小方盒,屏幕上却跑着需要服务器机房才能驱动的大模型。没有风扇呼啸,没有机箱发热,连一根多余的线都不需要。

好的计算也许就像好的设计:当你不再需要思考显卡够不够、内存满不满、驱动装没装的时候,就可以把全部注意力放回到你真正想做的事上。

相关内容

热门资讯

有连云GEO如何助推金融机构从... 范式更迭:从“谁声音更大”转向“谁的信息更值得被信任” 在生成式AI重塑的今天,传统的SEO(搜索引...
千问开源大模型荣获浙江省科技进... 央广网北京2月10日消息(记者 殷雨婷)2月9日,2024年度浙江省科学技术奖揭晓,“千问开源大模型...
凯思凯迪完成近5亿元新一轮融资 投资界2月10日消息,凯思凯迪宣布完成近5亿元新一轮融资。本轮融资由中平资本领投,国寿资本、清松资本...
盈米基金旗下且慢“AI小顾”升... 上证报中国证券网讯(记者 朱妍)“为进一步提升和拓展AI小顾的服务能力、覆盖更多元的服务场景,且慢平...
中医脑机接口技术破冰 市场迎来... 当传统针灸遇上现代脑机接口技术,不仅实现了跨时空的技术对话,更点燃了一个新兴产业的发展引擎。 近日,...
常州特速安取得液力缓速器用减震... 国家知识产权局信息显示,常州特速安机电科技有限公司取得一项名为“一种液力缓速器用减震板”的专利,授权...
市场最前沿|春节自驾出行,新能... 新华社北京2月10日电 题:春节自驾出行,新能源车如何“满电”出发? 新华社记者唐诗凝、戴小河、吴慧...
外交部:日方如果真心想发展中日... 2月10日,外交部发言人林剑主持例行记者会。有记者提问,日本首相高市早苗昨天表示对与中国对话持开放态...