智谱为豆包手机助手的处境“再添一把火”。
12月9日,智谱AI宣布将其核心AI Agent模型AutoGLM全面开源,这一动作被业界视为全球首个具备“Phone Use”(手机操作)能力的AI智能体技术开放。
该模型能够稳定完成外卖点单、机票预订等长达数十步的复杂操作流程,目前已支持微信、淘宝、抖音、美团等超过50个高频中文应用的核心场景。
AutoGLM的研发始于2023年4月,历经32个月的技术攻坚。
2024年10月,智谱在中国计算机大会(CNCC)上首次展示该模型,其突破在于将AI的规划能力与界面定位能力分离,通过“Planner(规划层)+Grounder(定位层)”的双层架构,解决了传统模型“看得懂但点不准”的难题。
2025年8月,AutoGLM 2.0版本进一步引入云端虚拟手机集群训练,使模型能在上千台虚拟设备中并行学习,强化错误恢复与泛化能力。此次开源内容包含训练好的核心模型、工具链、覆盖50余款应用的Demo及Android适配层,采用MIT与Apache-2.0双许可证,旨在降低开发者应用门槛。
智谱此次开源,直指AI手机生态“少数厂商垄断”的潜在风险。
智谱公开表示,“AI手机只在一家公司做是不够的”,若Phone Use能力被封闭在少数平台,开发者创新将受制于接口开放程度,用户设备也可能沦为“他者入口”。
此外,隐私保护是另一关键考量。AutoGLM通过云端虚拟手机沙箱运行,用户敏感数据(如支付、聊天记录)与AI操作环境物理隔离,且支付、发布等高风险动作需用户二次确认。开源后,企业可借助私有化部署将数据控制权留在本地,规避隐私泄露风险。
日前,豆包手机助手刚发布,却在多个大厂应用上屡屡“碰壁”,引发行业对“超级入口”垄断的担忧,而智谱以开源策略降低技术门槛,可能加速中小厂商入场,形成多元化AI手机生态。