【大河财立方 记者 丁洋涛 文图】作为人工智能领域的焦点,大模型技术正在不断驱动AI应用的升级和创新,进入与现实业务深度整合的关键时期,更多企业致力于深化业务场景探索,以期释放大模型落地带来的价值。
6月11日,字节跳动旗下火山引擎举办Force原动力大会,发布豆包大模型1.6、视频生成模型Seedance 1.0 pro等新模型,并升级了Agent开发平台等AI云原生服务。
字节跳动CEO梁汝波表示:“字节跳动致力成为优秀的创新科技公司,会坚定长期投入,追求智能突破,服务产业应用。通过火山引擎,持续把新模型、新技术开放给企业客户。”
豆包大模型交出最新答卷:全线迈入全球第一梯队
2025年高考刚刚结束,全国高考新一卷数学试题刚刚出现,豆包大模型1.6版就“提笔上阵”答题,最终交出144分的高分答卷;以往不能唱歌的豆包,也学会了唱情歌,在6月11日发布会现场高歌一首《月亮代表我的心》。这是字节系大模型在新一轮人工智能竞赛中交出的新答卷。
火山引擎总裁谭待现场发布豆包大模型1.6版时介绍,该模型强推理能力并不仅限于单独科目,在海淀模拟全卷考试中,理科试卷拿下706分,文科试题考了712分,妥妥的大模型“学霸”。
这些都是新版豆包能力的具象化表现。会上,豆包1.6模型披露了多项权威测评成绩。在复杂推理、竞赛级数学、多轮对话和指令遵循等测试集上,豆包1.6-thinking的表现已跻身全球前列。
据火山引擎总裁谭待介绍,豆包1.6系列模型支持多模态理解和图形界面操作,能够理解和处理真实世界问题。
此前,豆包1.5的多模态能力在60个公开评测基准中取得38项最佳成绩,已广泛应用在电商识图、自动驾驶数据标注、门店巡检等场景。图形界面操作能力则让豆包1.6进一步具备“行动力”。演示案例显示,豆包1.6可自动操作浏览器完成酒店预定,识别购物小票并整理成Excel表格等任务。
图:火山引擎总裁谭待
除了原有能力升级外,现场还发布了足以跻身视频生成模型前列的Seedance 1.0 pro。该模型支持文字与图片输入,可生成多镜头无缝切换的1080p高品质视频,主体运动稳定性与画面自然度较高。
在国际知名评测榜单Artificial Analysis上,Seedance 1.0 pro在文生视频、图生视频两项任务上均排名首位,超越Veo3、可灵2.0等优秀模型。
至此,豆包大模型现已涵盖多模态、视频、图像、语音、音乐等模型品类,全方位推进智能提升和应用落地。在行业应用上,豆包大模型服务着全球TOP10手机厂商中的9家、八成主流汽车品牌、70%的系统重要性银行及超五成985高校。
数据显示,豆包大模型日均tokens使用量超过16.4万亿,较去年5月首次发布时增长137倍。另据IDC(互联网数据中心)报告,豆包大模型在中国公有云大模型市场份额排名第一,占比高达46.4%。
模型成本一降再降,Agent(智能体)规模化应用提速
IDC发布的《中国AI Agent应用市场概览(2025Q1)》(以下简称概览)显示,在多元化需求的强劲驱动下,2024年中国AI Agent软件市场规模已成功突破50亿元人民币大关。AI Agent正在从“辅助工具”向“自主生产力”跃迁。
谭待表示,深度思考、多模态和工具调用等模型能力提升,是构建Agent的关键要素。同时,由于Agent每次执行任务都会消耗大量tokens,模型使用成本也要降下来,才能推动Agent的规模化应用。
通过技术和商业的双重创新,豆包1.6首创按“输入长度”区间定价,深度思考、多模态能力与基础语言模型统一价格。在企业使用量最大的0—32k输入区间,豆包1.6的输入价格为0.8元/百万tokens、输出8元/百万tokens,综合成本只有豆包1.5深度思考模型或DeepSeek R1的三分之一。Seedance 1.0 pro模型每千 tokens仅0.015元,每生成一条5秒的1080P视频只需3.67元,为行业最低。
为了更好地支持Agent开发与应用,火山引擎AI云原生全栈服务升级,发布了火山引擎MCP(模型上下文协议)服务、PromptPilot 智能提示工具、AI知识管理系统、veRL(Volcano Engine Reinforcement Learning)强化学习框架等产品,并推出多模态数据湖、AICC隐私计算、大模型应用防火墙,以及一系列AI Infra套件。
图:字节跳动技术副总裁洪定坤
字节跳动技术副总裁洪定坤认为,随着模型能力的持续进步,AI有机会成为调度者,通过调用不同的Agent和工具,让软件开发“all in one”(一站式开发),更大幅度地降低开发门槛,提升开发效率。洪定坤表示,豆包1.6模型在编程能力上进步很大,已经接入字节的AI编程产品TRAE内测,新模型将很快推送给用户。
据洪定坤透露,在字节内部,超过80%的工程师在使用TRAE辅助开发。TRAE的整体月活用户已经超过了100万。
谭待认为,技术主体经历了三个时代变化,AI时代会推动开发范式与技术架构全面升级。他说:“PC时代主体是Web,移动时代是APP,AI时代则是Agent。Agent能够自主感知、规划和反思,完成复杂任务。从被动工具转变为主动执行者。豆包大模型和AI云原生将持续迭代,助力企业构建和大规模应用Agent。”
IDC概览显示,未来四年,该市场将以超过60%的年复合增长率(CAGR)迅猛增长。2025年,AI Agent更是迎来规模化落地的浪潮,凭借其智能化任务处理能力重构标准化作业流程的巨大潜力。
业内专家认为,2025年的大模型竞争已进入“效能优先、场景为王、生态制胜”的新阶段,大模型多模态、轻量化、强推理成为标配,未来属于能打通行业Know-How(如火山引擎拆解金融、汽车场景)并构建开放生态的厂商。随着大模型能力持续突破、云原生架构普及、开发工具链完善,智能体正从“实验性应用”变为“企业标配”。
责编:刘安琪 | 审校:张翼鹏 | 审核:李震 | 监审:古筝