AIPress.com.cn报道
Oracle 正在重新定义“AI超算”的概念。公司今日正式发布 Oracle Cloud Infrastructure(OCI)Zettascale10,被称为全球最大云端AI超级计算系统,峰值算力高达 16 ZettaFLOPS(即每秒16×10²¹次浮点运算),成为目前业界云端AI算力的天花板。
根据Oracle官方介绍,OCI Zettascale10通过连接数十万颗NVIDIA GPU,跨多个数据中心形成多吉瓦级AI算力集群(multi-gigawatt clusters),可同时运行训练型与推理型大模型任务。
该系统采用 Oracle Acceleron RoCE 下一代高速网络架构,具有以下核心技术优势:GPU-GPU极低延迟,在超大规模集群中保持纳秒级通信延迟;领先的价格性能比,大规模训练成本显著优于传统超算;高可靠性与高利用率,确保万级节点下的负载均衡与任务调度稳定;模块化扩展性,支持跨数据中心扩展,可动态加入新节点。
Oracle称,这一平台“将AI计算的物理极限,首次以云形态推向Zetta级别”。
OCI Zettascale10是 OpenAI位于美国德克萨斯州Abilene的Stargate超级集群的核心底层架构。该项目是OpenAI、Oracle与NVIDIA三方合作的旗舰工程,目标是打造支撑 GPT-6及其后续模型的云端AI基础设施。
其中,Oracle提供Zettascale10的整体网络与调度系统;NVIDIA提供Hopper系列及Blackwell GPU集群;OpenAI负责上层模型与任务调度算法。这一组合被业内称为“AI基础设施三巨头联盟”,其算力规模超过全球前五超算中心之和。
Oracle同时确认,已与 AMD 建立长期芯片供应合作关系,用于下一代 Zettascale10混合集群架构。AMD的Instinct系列GPU将被用于特定推理与可再生能效优化场景,成为Oracle多芯异构计算布局的重要部分。
业内分析认为,随着OpenAI近期与AMD签署6GW GPU部署协议,Oracle此举或将进一步推动 AMD成为NVIDIA之外最具潜力的AI加速器替代者。
Oracle云基础设施执行副总裁Clay Magouyrk表示:
“Zettascale10代表了AI时代的‘算力主干网’。我们希望让全球开发者能够在云上获取此前只有政府级超算中心才能拥有的计算能力。”
NVIDIA创始人黄仁勋亦评论称:
“Oracle在大规模GPU集群部署上的工程能力令人惊叹,Zettascale10将成为AI工业化的重要分水岭。”
Zettascale10不仅是硬件规模的突破,更标志着AI计算正进入能源级基础设施化阶段:计算集群单位不再以Peta或Exa计,而以“吉瓦(GW)”为能耗与算力的双指标;数据中心正成为新型“电厂”,算力被视为“电能的第二形态”;OpenAI、Oracle与NVIDIA正在形成AI基础设施“三极格局”。
这一体系将直接影响全球AI大模型的迭代速度与算力定价权:未来AI生态的竞争,不仅是算法层的智能之争,更是云、芯、电、网的全栈博弈。