字节跳动豆包大模型2.0发布,多数基准达SOTA水平
创始人
2026-02-15 00:41:15
0

IT之家 2 月 14 日消息,字节跳动宣布,今天,豆包大模型正式进入 2.0 阶段。豆包 2.0(Doubao-Seed-2.0)围绕大规模生产环境下的使用需求做了系统性优化,依托高效推理、多模态理解与复杂指令执行能力,更好地完成真实世界复杂任务。

IT之家注意到,豆包 2.0 系列包含 Pro、Lite、Mini 三款通用 Agent 模型和 Code 模型,灵活适配各类业务场景:

  • 豆包 2.0 Pro 面向深度推理与长链路任务执行场景,全面对标 GPT 5.2 与Gemini 3 Pro
  • 2.0 Lite 兼顾性能与成本,综合能力超越上一代主力模型豆包 1.8;
  • 2.0 Mini 面向低时延、高并发与成本敏感场景;
  • Code 版(Doubao-Seed-2.0-Code)专为编程场景打造,与TRAE结合使用效果更佳。

目前,豆包 2.0 Pro 已在豆包 App、电脑端和网页版上线,用户选择「专家」模式即可对话体验;豆包 2.0 Code 接入了 AI 编程产品 TRAE;面向企业和开发者,火山引擎也已上线豆包 2.0 系列模型 API 服务。

多模态理解能力全面升级,多数基准达 SOTA 水平

豆包 2.0 全面升级了多模态能力,在各类视觉理解任务上均达到世界顶尖水平,视觉推理、感知能力、空间推理与长上下文理解能力表现尤为突出,豆包 2.0 Pro 在大多数相关基准测试中取得最高分

面对动态场景,豆包 2.0 强化了对时间序列与运动感知的理解能力,在TVBench等关键测评中处于领先位置,且在 EgoTempo 基准上超过了人类分数,表明它对“变化、动作、节奏”这类信息的捕捉更为稳定,在工程侧可用性更高。

长视频场景中,豆包 2.0 在大多评测上超越了其他顶尖模型,且在多个流式实时问答视频基准测试中表现优异,能作为 AI 助手完成实时视频流分析、环境感知、主动纠错与情感陪伴,实现从被动问答到主动指导的交互升级,可应用于健身、穿搭等陪伴场景。

LLM与 Agent 表现大幅强化,长程任务执行能力提升

提升长程任务执行能力,需要丰富的真实世界知识。通过加强长尾领域知识,豆包 2.0 Pro 在 SuperGPQA 上分数超过 GPT 5.2,并在 HealthBench 上拿到第一名,在科学领域的整体成绩与 Gemini 3 Pro 和 GPT 5.2 相当。

在推理和 Agent 能力评测中,豆包 2.0 Pro 在 IMO、CMO 数学奥赛和 ICPC 编程竞赛中获得金牌成绩,也超越了 Gemini 3 Pro 在 Putnam Bench 上的表现,展现了强劲的数学和推理能力。在HLE-text(人类的最后考试)上,豆包 2.0 Pro 取得最高分 54.2 分,在工具调用和指令遵循测试中也有出色表现。

豆包 2.0 还进一步降低了推理成本。其模型效果与业界顶尖大模型相当,但 token 定价降低了约一个数量级。在现实世界的复杂任务中,由于大规模推理与长链路生成将消耗大量 token,这一成本优势将变得更为关键。

Code 模型提升开发效率,快速搭建复杂应用

豆包 2.0 Code 是基于 2.0 基座模型,针对编程场景进行优化的版本。其强化了代码库解读能力,还提升了应用生成能力。此外,豆包 2.0 Code 还增强了模型在 Agent 工作流中的纠错能力。

该模型已上线 TRAE 中国版作为内置模型,支持图片理解和推理。

以开发一个「TRAE 春节小镇 · 马年庙会」互动项目为例。这是一个比较复杂的场景,但是通过 TRAE+ 豆包 2.0 Code,只需要 1 轮提示词,就能构建出基本的架构和场景,再经过几次调试,总共 5 轮提示词,就可完成这个作品。

字节跳动官方称,豆包大模型 2.0 系列的更新,是面向现实世界复杂任务的新起点。未来,团队将继续面向真实场景迭代模型,不断探索智能上限。

相关内容

热门资讯

从幽州到南京,古代北京如何从“... 至少自商代后期就已存在的蓟国之都蓟城,在周朝相继做了蓟国与燕国的都城,秦汉至隋唐时期一直是中国北方军...
普通人如何在"战争溢... 最近中东那边又炸了。 美国和以色列对伊朗发动军事袭击,英法德相继宣布参战,伊朗则直接宣布关闭霍尔木兹...
定增市场显著回暖,基金公司积极... 11月29日消息,进入四季度以来,A股定增市场明显回暖。Wind数据显示,截至记者发稿,今年10月份...
马斯达尔完成收购特尔纳能源的交... 11月29日消息,阿布扎比未来能源公司PJSC–Masdar(马斯达尔)宣布,已成功完成从GEK T...
盛松成:降准、降息仍有空间 11月28日消息,中欧国际工商学院经济学与金融学教授盛松成今日在一场演讲中表示,“我认为,未来一段时...
中信出版:《黑神话:悟空》衍生... 11月28日消息,中信出版在互动平台表示,公司将推出《黑神话:悟空》衍生画集《影神图》。
飞天茅台终端市场成交价格下跌,... 11月28日消息,近日走访部分终端市场发现,目前53度500ml飞天茅台散瓶装终端市场价格为2200...
香港证监会:中国森林前主席及前... 11月28日消息,香港证监会公布的信息显示,香港市场失当行为审裁处要求中国森林前行政总裁李寒春,及其...
中国贸促会会长任鸿斌:链博会核... 11月28日消息,中国贸促会会长任鸿斌一行27日下午到第二届中国国际供应链促进博览会(简称“链博会”...
《柳叶刀》最新研究:哮喘和慢阻... 11月28日消息,《柳叶刀》杂志发表研究称,贝那利珠单抗注射治疗哮喘和慢阻肺比类固醇片剂更有效,可减...