这期播客主要围绕AI技术发展,尤其是Agent概念和Manus产品展开讨论,涵盖从AI 1.0到2.0的变革、Agent定义、Manus的特点及应用、面临的争议,还探讨了AI行业的发展趋势和商业格局。
1. AI发展历程与核心概念:AI发展经历了从AI 1.0到AI 2.0的阶段。AI 1.0是单领域、多模型的,存在数据集和模型孤立、数据标注劳动密集等问题;AI 2.0用超级海量数据训练基础模型,实现跨领域任务执行。当前,从L1到L3的发展中,L1的聊天机器人具有对话能力,L2-L3之间是当前的发展区间,L3的Agent能协助发明创造、组织工作 。Agent的定义包含Planning(规划)、Memory(记忆)、Tools(工具使用)和其他Agent通信交互等方面,但目前概念被泛化。
2. 从L1到L3的技术实现与思考:技术上通过预训练和强化学习实现发展,像从OpenAI - o1到DeepSeek - R1,模型训练要让其摆脱人类经验限制,通过自我博弈提升能力,如AlphaGo Zero的成功。在走向L2的过程中,采用Chain of Thought(思维链)和过程监督奖励模型(PRM),避免结构化方法限制模型,允许模型在思考中探索和犯错 。
3. Manus产品深度剖析
功能展示:Manus是一款通用Agent产品,能完成复杂任务,如分析特斯拉股票,涵盖评估市场情绪、技术分析、对比竞争对手等步骤,还能制作金句PDF、收集应用图标、分析a16z最新TOP100榜单中中国公司产品等 。
使用体验:在一些复杂任务上表现出一定能力,但也存在问题,如在长文本处理时性能下降,遇到服务负载高时无法创建任务,处理任务时还可能出现格式错误等情况,整体能力被评价为“实习生级别” 。
技术优势与特点:其创新在于类似为“实习生”配备浏览器、数据库权限等工具,借助虚拟服务器,让模型可自主写代码调用API,执行各种长尾任务 。在GAIA Benchmark测试中,Manus在不同难度等级题目上取得了一定成绩,相比其他产品有一定优势 。
4. 行业争议与思考:Manus引发了诸多争议,有人认为它是套壳产品、没有技术创新,也有人质疑其发展前景。但也有人指出,判断一个产品不能只看表面,开发产品涉及需求挖掘、功能实现、宣传推广等多个环节,只复制部分功能不能等同于做出优秀产品 。此外,关于Agent到底是模型还是产品,目前尚无定论,像OpenAI的产品也涉及模型与产品的关系探讨。在商业层面,大厂通常会跟进有潜力的技术方向,海外以年化经常性收入(ARR)为重要衡量标准 。
免责声明:我们尊重知识产权、数据隐私,只做内容的收集、整理及分享,报告内容来源于网络,报告版权归原撰写发布机构所有,通过公开合法渠道获得,如涉及侵权,请及时联系我们删除,如对报告内容存疑,请与撰写、发布机构联系