阿里千问发布Qwen3-Coder-Next:低推理成本编程智能体模型
创始人
2026-02-04 08:01:30
0

IT之家 2 月 4 日消息,阿里巴巴千问宣布推出 Qwen3-Coder-Next,一款专为编码代理与本地开发打造的开放权重的语言模型。

该模型基于 Qwen3-Next-80B-A3B-Base 构建,采用混合注意力与 MoE 的新架构;通过大规模可执行任务合成、环境交互与强化学习进行智能体训练,在显著降低推理成本的同时,获得了强大的编程与智能体能力。

IT之家附官方详细介绍如下:

扩展智能体训练

Qwen3-Coder-Next 不依赖单纯的参数扩展,而是聚焦于扩展智能体训练信号。我们使用大规模的可验证编程任务与可执行环境进行训练,使模型能够直接从环境反馈中学习。训练过程包括:

  • 在以代码与智能体为中心的数据上进行持续预训练
  • 在包含高质量智能体轨迹的数据上进行监督微调
  • 领域专精的专家训练(如软件工程、QA、Web / UX 等)
  • 将专家能力蒸馏到单一、可部署的模型中

该配方强调长程推理、工具使用以及从执行失败中恢复,这些对现实世界中的编程智能体至关重要。

  • 在编程智能体基准上的表现
  • 面向智能体的基准结果

下图汇总了在多个广泛使用的编程智能体基准上的表现,包括 SWE-Bench(Verified、Multilingual、Pro)、TerminalBench 2.0 和 Aider。

图中表明:

  • 使用 SWE-Agent 框架时,Qwen3-Coder-Next 在 SWE-Bench Verified 上达到 70% 以上。
  • 在多语言设置以及更具挑战的 SWE-Bench-Pro 基准上保持竞争力。
  • 尽管激活参数规模很小,该模型在多项智能体评测上仍能匹敌或超过若干更大的开源模型。
效率与性能的权衡

下图展示了 Qwen3-Coder-Next 如何在效率与性能之间取得更优的帕累托权衡。

这一对比清晰体现了效率优势:

  • Qwen3-Coder-Next(3B 激活)的 SWE-Bench-Pro 表现可与激活参数量高 10 到 20 倍的模型相当。
  • 尽管专有的全注意力模型在绝对性能上仍然领先,Qwen3-Coder-Next 在面向低成本智能体部署方面处于强势的帕累托前沿。
总结与未来工作

Qwen3-Coder-Next 在编程智能体基准上展现出良好前景,在实用场景中具备不错的速度与推理能力。尽管其表现可与部分更大的开源模型竞争,仍有很大改进空间。

展望未来,我们认为强大的智能体能力 —— 如自主使用工具、应对难题、管理复杂任务 —— 是更好编程智能体的关键。接下来我们计划提升模型的推理与决策能力、支持更多任务,并根据使用反馈快速迭代更新。

开源地址

ModelScope:

Hugging Face:

相关内容

热门资讯

4分钟了解!拱趴大菠萝辅助器最... 4分钟了解!拱趴大菠萝辅助器最新更新内容介绍(辅助)汕尾联友开挂辅助修改器-总是是真的下载1.拱趴大...
一分钟了解!凑一桌游戏辅助神器... 一分钟了解!凑一桌游戏辅助神器(辅助)天天爱蚌埠麻将开挂辅助app-竟然真的是有辅助器1、每一步都需...
第十分钟了解!新九九辅助(辅助... 第十分钟了解!新九九辅助(辅助)九星广西棋牌开挂辅助安装-总是是真的修改器1、每一步都需要思考,不同...
第七分钟了解!楚天游辅助(辅助... 第七分钟了解!楚天游辅助(辅助)66徐州麻将开挂辅助辅助器-一直有挂工具1、楚天游辅助辅助软件下载优...
第八分钟了解!约局吧辅助下载手... 第八分钟了解!约局吧辅助下载手机(辅助)天涯麻将开挂辅助神器-一贯是有平台约局吧辅助下载手机能透视中...
7分钟了解!葫芦娃通杀辅助使用... 7分钟了解!葫芦娃通杀辅助使用(辅助)泰豪娱乐开挂辅助安装-好像存在有平台亲,关键说明,葫芦娃通杀辅...
八分钟了解!免费吉祥填大坑有插... 八分钟了解!免费吉祥填大坑有插件吗(辅助)大玩家开挂辅助脚本-一贯真的有下载1、点击下载安装,免费吉...
第一分钟了解!科乐填大坑辅助器... 第一分钟了解!科乐填大坑辅助器(辅助)沐辉麻将开挂辅助工具-确实存在有工具1、点击下载安装,科乐填大...
第一分钟了解!欢聚水鱼脚本(辅... 第一分钟了解!欢聚水鱼脚本(辅助)微乐斗地主开挂辅助工具-其实是有神器欢聚水鱼脚本辅助器是一种具有地...
两分钟了解!四川辅助工具(辅助... 两分钟了解!四川辅助工具(辅助)凯旋麻将开挂辅助修改器-切实是真的安装1、四川辅助工具透视辅助软件激...