阿里开源「深度研究」王炸Agent,登顶开源Agent模型榜首
创始人
2025-09-18 01:41:56
0

▲头图由AI生成

智东西

作者 | 王涵

编辑 | 漠影

智东西9月17日报道,今天凌晨,阿里巴巴开源了其首个深度研究Agent模型:通义DeepResearch

在Humanity’s Last Exam(HLE)、BrowseComp、BrowseComp-ZH、GAIA、xbench-deepsearch、WebWalkerQA以及Frames等权威Agent评测集中,通义DeepResearch模型凭借3B激活参数,性能超越基于OpenAI o3DeepSeek V3.1Claude-4-Sonnet等旗舰模型的ReAct Agent(推理-行动智能体)。

▲基准测试成绩排名

▲基准测试分数

目前,通义DeepResearch的模型、框架和方案已在Github、Hugging Face和魔搭社区全面开源,开发者和用户可自行下载模型与代码。

下载地址:

Github:

https://github.com/Alibaba-NLP/DeepResearch

Hugging Face:

https://huggingface.co/Alibaba-NLP/Tongyi-DeepResearch-30B-A3B

魔搭社区:

https://modelscope.cn/models/iic/Tongyi-DeepResearch-30B-A3B

深度研究作为近一年的AI研究热点,吸引了谷歌、OpenAI、Anthropic等众多主流企业投入研发。

深度研究研发的现有方法大多采用“单窗口、线性累加”的信息处理模式,在处理长周期任务时,Agent易遭遇“认知空间窒息”与“不可逆的噪声污染”,导致推理能力降低,难以完成复杂研究任务。

据介绍,为解决这些问题,阿里通义团队构建了一套合成数据驱动的完整训练链路,覆盖预训练与后训练阶段。

该链路以Qwen3-30B-A3B模型为基础进行优化,设计了RL算法验证与真实训练模块,涵盖真实与虚拟环境,并借助异步强化学习算法及自动化数据策展流程,有效提升了模型的迭代速度与泛化能力。

在推理阶段,通义团队还设计了ReAct基于自研IterResearch的Heavy两种模式。ReAct用于精准评估模型的基础内在能力,Heavy则通过test-time scaling策略,充分挖掘模型的性能上限,确保在长任务中也能实现高质量推理。

结语:阿里进一步补全开源布局

今年以来,阿里已陆续开源WebWalker、WebDancer和WebSailor等多款检索和推理智能体,且均取得开源SOTA成绩。通义DeepResearch的开源,进一步丰富了阿里在AI智能体领域的开源布局。

通义DeepResearch的开源为深度研究Agent赛道提供了“轻量化高性能”的新选择,也为全球开发者攻克长周期复杂研究任务提供了关键工具支撑。

相关内容

热门资讯

错失命名机会,鲁宾天文台提前观... IT之家 5 月 17 日消息,原来星际彗星 3I / ATLAS 差一点就被命名为 3I / Ru...
透视规律!wepoker怎么设... 透视规律!wepoker怎么设置房间(透视)本来有辅助工具(有挂解惑)-哔哩哔哩1、wepoker怎...
详细透视!aapoker怎么设... 详细透视!aapoker怎么设置提高好牌几率!信息共享辅助神器(竟然有挂)-哔哩哔哩1、aapoke...
百“虾”混战升级,百度押注超级... (百度集团执行副总裁、百度智能云事业群总裁沈抖) 本报记者卢晓 北京报道 随着OpenClaw引发百...
现就发布提示!安装不了wepo... 现就发布提示!安装不了wepoker(透视)竟然是有辅助平台(有挂教学)-哔哩哔哩;1、这是跨平台的...
辅助透视!拱趴大菠萝作弊方法!... 辅助透视!拱趴大菠萝作弊方法!一分钟教会你辅助挂(有挂技巧)-哔哩哔哩1、该软件可以轻松地帮助玩家将...
透视神器!wpk模拟器是什么(... 透视神器!wpk模拟器是什么(透视)总是真的是有辅助修改器(有挂工具)-哔哩哔哩wpk模拟器是什么是...
解迷透视!wepoker怎么买... 您好,wepoker怎么买辅助这款游戏可以开挂的,确实是有挂的,需要了解加去威信【485275054...
透视透视!hhpoker辅助挂... 透视透视!hhpoker辅助挂是真的吗(透视)好像真的是有辅助app(发现有挂)-哔哩哔哩1、每一步...
详细透视!wepoker有没有... 详细透视!wepoker有没有插件!一分钟揭秘辅助工具(有挂实锤)-哔哩哔哩1、点击下载安装,wep...