阶跃星辰发布天然适配国产芯片、最适合应用的模型Step 3
创始人
2025-07-27 14:41:31
0

IT时报记者 孙妍

在2025世界人工智能大会(简称“WAIC 2025”)开幕前一天,四位国产芯片大佬首度同台,沐曦创始人、董事长兼总经理陈维良,天数智芯董事长兼CEO盖鲁江,燧原科技创始人、董事长兼CEO赵立东和壁仞科技创始人、董事长兼CEO张文围绕“大模型与芯片的协同”,进行了一场对话。

四位大佬罕见同台的一幕发生在阶跃星辰的新一代基础大模型Step 3的发布会上,模型是这场发布会的主角,Step 3被认为是天然适配国产芯片、最适合推理应用的模型,实现了行业领先的推理解码效率,在国产芯片上的推理效率最高可达DeepSeek-R1的300%。

国产大模型和国产算力的双向奔赴,加速推动AI真正被各行各业用起来,正是国产芯片半壁江山首度同台的重要契机。阶跃星辰也宣布,Step 3将于7月31日面向全球企业和开发者开源。

推理时代最适合应用的模型

大模型正在迈向推理时代,什么样的模型最适合实际应用?

阶跃星辰认为,只有满足强智能、低成本、可开源和多模态四个特征的模型,才是最适合应用的模型。这四个维度缺一不可,因为单点能力强,无法满足用户对于模型的综合需求。唯有模型全面发展,才能让模型真正用起来。

Step 3是阶跃星辰首个全尺寸、原生多模态推理模型,兼顾模型效果与推理成本,是在模型架构创新、算法工程协同设计上的一次大胆尝试。Step 3采用 MoE 架构,总参数量 321B,激活参数量38B。

Step 3拥有视觉感知和复杂推理能力,可准确完成跨领域的复杂知识理解、数学与视觉信息的交叉分析,以及日常生活中的各类视觉分析问题。Step 3在MMMU、MathVision、SimpleVQA、AIME 2025、LiveCodeBench (2024.08-2025.05) 等榜单上取得了开源多模态推理模型的SOTA成绩。

天然适配国产芯片的模型

在推理时代,模型性能随思维链的增长而提升,解码效率因此成为降低成本的关键。目前,主流开源模型虽然针对解码进行了大量优化,但其优化方案主要适配国际高端芯片,在中端及国产芯片上的解码效率仍有提升空间。

Step 3的目标是通过系统性的技术创新实现模型降本增效。在架构设计阶段,Step 3便考量系统与硬件的特性,实现广泛硬件平台上的高效推理。凭借系统和架构创新,Step 3实现了行业领先的推理解码效率。根据原理分析,Step 3在国产芯片上的推理效率最高可达DeepSeek-R1的300%,且对所有芯片友好。在基于NVIDIA Hopper架构的芯片进行分布式推理时,实测Step 3相较于 DeepSeek-R1的吞吐量提升超70%。这些都是在不牺牲激活参数量、不降低注意力容量的条件下实现的。这些结果充分验证了 Step 3具备广泛的普适性,在多种硬件环境下部署,均能显著地降低推理成本。

目前,Step 3已授权国内多家芯片公司,并完成芯片适配。同时,Step 3将于7月31日正式面向全球企业和开发者开源,已经通过开源技术报告,与全球开发者分享了大幅降低推理成本背后的系统架构创新。

让大模型真正用起来

要让大模型真正能用起来,需要从模型、芯片、平台到应用的全产业链协同创新。

阶跃星辰宣布联合近10家芯片及基础设施厂商,共同发起“模芯生态创新联盟”,打通芯片、模型和平台全链路技术,将为企业和开发者提供高效易用的大模型解决方案,加速应用落地。

该联盟的首批成员包括华为昇腾、沐曦、壁仞科技、燧原科技、天数智芯、无问芯穹、寒武纪、摩尔线程、硅基流动等。目前,华为昇腾芯片已首先实现Step 3的搭载和运行,沐曦、天数智芯和燧原科技等也已初步实现运行Step 3,其它联盟厂商的适配工作正在开展。

发布会上,上海国有资本投资有限公司与阶跃星辰宣布深度战略合作,双方将围绕加强资本链接、生态建设、业务协同、应用赋能等方面进行全面的深度合作。上海国投生态体系将在近期参与投资阶跃星辰的最新一轮融资。

成立两年多以来,阶跃星辰构建起“1+N”的Step系列大模型矩阵。“1”是指Step 3基础大模型;“N”则为Step系列的多模态大模型矩阵,覆盖语音、视觉理解、图像编辑、图像和视频生成、音乐等领域。本次WAIC期间,阶跃亦升级了多模态模型,包括阶跃首个多模理解生成一体化模型Step 3o Vision,第二代端到端语音大模型Step-Audio 2。

阶跃星辰计划将2025全年收入冲刺目标定为10亿元人民币。战略上,阶跃星辰聚焦智能终端Agent的方向,重点布局汽车、手机、IoT设备等关键应用场景,已覆盖国内超过一半头部国产手机厂商,深度合作打造手机 Agent体验;联合吉利推出AI智能座舱,实现行业内端到端语音大模型首次量产上车。另一方面,阶跃星辰正在拓展垂直行业的应用,与金融财经、内容创作、零售等领域的行业头部公司深度合作,共同打造面向C端的场景化应用,比如在城市治理方面,与上海电信打造出城市服务新标杆——数字电话亭,为这张城市名片注入AI能力,在数字公话亭里提供AI助老、AI文旅、AI政务等功能。

作为一家以实现通用人工智能(AGI)为目标的基础大模型公司,阶跃星辰创始人、CEO姜大昕表示:“从Step 1到Step 2两代基模的快速迭代,促使我们深入思考什么才是最适合应用的模型。随着大模型进入到强化学习发展阶段,新一代推理模型成为主流,模型性能的提升固然显著,但这是否完全等同于模型价值?面对这一产业之问,我们必须回归客户需求,立足真实应用场景,探索模型创新落地的可行路径。这是我们研发新一代Step 3基础模型的出发点。”

相关内容

热门资讯

90后养老就靠它?清华系机器人... 新智元报道 编辑:编辑部 【新智元导读】WAIC大会上,这个机器人凭惊艳实力引起了层层围观!叠衣服...
东有浦东“模力社区”!一个垂类... 7月26日,2025世界人工智能大会拉开序幕。投用一年的浦东模力社区携创新企业“组团出征”,通过社区...
泽连斯基捅马蜂窝,副司令被抓,... 当地时间2025年7月22日深夜,乌克兰国家安全局局长瓦西里·马柳克中将发出严重警告,乌克兰调查局对...
神二十乘组签收“太空快递”后:... 央视网消息:近期,由陈冬、陈中瑞、王杰三名航天员组成的神二十乘组在轨迎来了天舟九号货运飞船,新一批“...
欧意诺取得冷包热型换热器专利,... 金融界2025年7月26日消息,国家知识产权局信息显示,河北欧意诺燃气设备有限公司取得一项名为“一种...
人工智能如何重塑医疗?顶尖医院... 人工智能正在重塑医疗健康产业生态,上海作为科创高地,近年在医疗AI领域举措不断。今天(7月27日),...
十分钟知道!德州ai软件使用,... 十分钟知道!德州ai软件使用,AApoker其实真的有挂,解说技巧(有挂方法)-哔哩哔哩1、玩家可以...
六分钟发现!德州可能有外挂吗,... 六分钟发现!德州可能有外挂吗,红龙扑克原来真的有挂,攻略教程!(有挂教学)-哔哩哔哩;值得一提的是,...
四分钟普及!手机德州app辅助... 四分钟普及!手机德州app辅助,WPK原来真的有挂,必备教程(有挂方法)-哔哩哔哩;科技详细教程小薇...
7分钟科普!德州ai机器人辅助... 7分钟科普!德州ai机器人辅助,德扑之星其实真的有挂,力荐教程(有挂技巧)-哔哩哔哩1、进入游戏-大...