仰望星空,双脚粘泥,百度AI的长期主义
作者丨瀚星
封面来源丨2024百度世界大会
PC时代从诞生到巅峰用了25年,移动互联网时代则花了10年以上时间,而AI或许会在未来一到两年就引发一场巨大的革命。这已经成为行业共识。
由ChatGPT引发的AI热潮已持续两年多,市面上出现了两种截然不同的声音:乐观派认为,AI正在重塑各行各业,将带来新一轮的生产力飞跃;悲观派则认为,AI热不过是另一场泡沫。
AI究竟是技术革命还是泡沫?
“百度信AI,不是今天才信,也不是两年前信,是十几年前就信这个东西。”11月12日的百度世界大会,百度创始人、CEO李彦宏在会后的一场访谈中表示。对于AI,李彦宏是一位理想主义者,他坚信AI时代一定会到来。
与此同时,他也有现实主义的一面。在这届百度世界大会上,李彦宏不谈高大上的AI理想,避开晦涩难懂的AI技术,而是将重心放在让更多的人去使用AI,让更多的人相信AI有用。
过去半年,文心大模型的日均调用量增长至15亿次,涨幅达到7.5倍。这对李彦宏来说是一个现实且积极的信号,越来越多的企业正在用AI提升工作效率,AI的应用场景呈指数级增长。
7年前,AI技术还只是少数科技公司所押注的小众赛道。彼时,坚定看好AI的李彦宏说过,当一个新时代来临,总有一部分人摩拳擦掌,一部分人随波逐流,还有一部分人茫然无措。
7年后,当AI逐渐成为共识,百度正摩拳擦掌,投身到下一个阶段——AI应用的全面爆发。
“今天百度世界大会之前,我觉得行业有比较大的困惑。到底应用在哪里?模型已经这么长时间,甚至有人觉得模型技术迭代速度已经慢下来了,但是超级应用没出现,那怎么办?”
李彦宏这番话,反映了AI大模型狂奔两年后遇到的瓶颈:在持续的高额投入下,市面上依旧没有出现一款现象级的超级AI应用。
两个多月前,高盛在报告《投入太多,收益太少》中提出,预计科技巨头和其他公司未来几年将在AI技术上投入约1万亿美元的资本支出,不过目前为止,这些投入取得的成果有限。
不仅如此,GPT-5迟迟没有发布,文生视频大模型Sora仍未全面开放。微软、英伟达等AI概念头部公司的市值也在上半年经历了一轮波动,资本市场开始对持续高投入所能产生的回报产生怀疑。
全行业的焦虑肉眼可见。
“如果把AI当做一个学术项目,北极星指标是‘哪一年或者哪一月能实现AGI’。从这个角度上讲,可以说技术进步的速度有所放缓。但我的视角更多是从应用角度看的,大模型的技术进步到底产生了什么应用?这个角度来说,我认为技术进步的速度不仅没有放慢,而且有变快的趋势。”
在李彦宏看来,AI大模型的技术迭代固然重要,但能否为人所用,才是AI价值的真正所在。
今年5月,百度文心大模型的日均调用量突破2亿。李彦宏在与百度高管讨论大模型的未来时提出,如果文心大模型的日均调用量在一年之内增长10倍,“我认为就成了,就说明大家是真需要(AI大模型)”。
事实上,仅仅过了6个月,文心大模型的日均调用量已经增长至7.5倍,距离“成了”的标准已经非常接近。从应用的角度来看,AI技术的发展确实跑得更快了。
行业中还有另一个疑问:AI超级应用到底在哪里?李彦宏也给出了自己的思考。他认为,现阶段智能体是AI应用的最主流形态,并且即将迎来它的爆发时刻。
当前,几乎全球所有AI相关公司都在关注智能体,但正如李彦宏所说,像百度这样把智能体作为最重要战略方向的并不多。“做智能体很像在PC时代做网站,或是在移动时代做自媒体账号。不同之处是智能体更像人、更智能,更像你的销售、客服、助理。智能体可能会变成AI原生时代内容、信息和服务的新载体。”
在李彦宏看来,百度押注智能体方向,与OpenAI最新发布的GPT o1类似。
“去年第四季度百度开始讲智能体,智能体有什么功能呢?有反思、进化、使用工具,这些能力也是今天GPT o1努力的方向,这个方向和传统意义上大语言模型的方向确实不一样。”
长远来看,随着AI智能体的爆发与生态繁荣,AI时代的超级应用将不再是虚无缥缈的空中楼阁。
零号智能体
过去一年,几乎所有AI主题相关大会讨论的话题,都离不开大模型技术、AGI(通用人工智能)、Scaling Law(尺度法则)。
但百度选择了另一种角度和方式。
这届百度世界大会的主题是“应用来了”。当被问及为什么选择这一主题时,李彦宏在访谈中表示,面对行业内对AI超级应用的困惑,百度可以把自己的探索、努力、工具,和找到的路径、方法分享给大家,同时也把其他人在百度平台上做出来的有价值的东西介绍给大家,这样可以让更多人找到自己发展的路径和方向。
言下之意,这场世界大会,既是让AI从业者吃下一颗定心丸,也是将过去一年百度为AI超级应用到来所准备的技术、工具展示出来。
过去一年,百度解决的一大行业痛点是多模态场景下的AI幻觉问题。
在AI热潮兴起后的两年多时间里,在文本生成中的AI幻觉问题已经被基本消除,但涉及到图像等多模态内容时,AI幻觉依然存在。
为此,百度开发了一项新技术:iRAG,即 image based RAG,检索增强的文生图技术。
此前,完全基于大语言模型的文生图系统,生成的图片常常是“一眼假”,逻辑不合理。iRAG可以将百度搜索的亿级图片资源和基础模型能力进行结合,这样就可以生成更加真实的图片,整体效果超过文生图的原生系统,去掉了“机器味儿”。
李彦宏认为,多模态幻觉问题是开发应用过程中百度率先发现的一个障碍,“必须把障碍搬走之后,我才能再往前走”。
事实上,从去年世界大会至今的一年时间里,百度在AI智能体的开发上投入了大量的精力。
以大会上最新发布的工具类智能体“自由画布”为例,它是由百度文库和网盘联合开发一款AI工具,可以将传统的图文与表格、视频、电话会录音等结合,组合生成一种更全面的多模态内容。
李彦宏表示,凭借这款工具,每个人都可以成为漫画家、短视频导演。
他在随后的访谈中介绍,“自由画布”的想法诞生时间其实并不长,大约在三四个月前。“主要是基于需求,最早是因为百度有一个产品叫文库,文库最早是找现成的文档,并不是做生成的。在生成式人工智能技术出现前,文库已经出现了。但是当有了生成式AI,我们发现人们最根本的需求,不是找一个现成的文档,而是创作自己的内容。”
也正因为如此,自由画布是一款非常“百度”的产品。
自由画布生成漫画
李彦宏认为,自由画布的诞生是建立在百度的Legacy(传承)基础之上的。“对百度文库的改造也好,自由画布的诞生也好,我们真正的legacy就是我信AI。百度信AI,不是今天才信,也不是两年前信,是十几年前就信这个东西。”
2012年,一位百度高管向李彦宏演示了深度学习技术对搜索的改进。李彦宏写了一封邮件,鼓励全百度的产品经理了解AI技术最新趋势。
2013年1月的百度公司年会上,李彦宏宣布成立深度学习研究院,这是全球企业界第一家用深度学习来命名的研究院,李彦宏出任院长。
此后,百度在10年间投入1700亿元资金布局AI。李彦宏在2021年的一封致股东信中表示,“10年前,我们意识到,人工智能技术智能已经成熟到可以解决搜索问题,以及搜索以外的很多问题,我们开始大举投入人工智能技术的研发,期待用技术让复杂的世界更简单。我们深知,最前沿的技术浪潮是等不来的,你必须提前10年、20年去布局。”
如今看来,他的愿景正在AI技术的发展下一步步成为现实。
在访谈过程中,李彦宏被问到一个问题:办一场只谈AI应用、不谈大模型参数和AI理想的大会,是不是意味着,百度更倾向于做一个AI发展的现实主义者?
李彦宏否认了这一说法。“我们没有讲的,并不表明我们没有做。我只是觉得,没有必要把这些只有极少数人才能够听得懂的东西到处去讲。我需要去讲的是,几千万人、几亿人确确实实能够用得到的东西,我希望多讲。”
李彦宏对AI的态度一直没有变过。
在AI热潮刚刚兴起,全行业都在卷大模型参数、卷大模型评分的时候,李彦宏就第一个站出来表示,“卷大模型没有意义,卷应用的机会更大”。当整个行业都在期待出现一款AI时代的超级应用、并为此焦虑的时候,李彦宏又呼吁行业不要掉入超级应用的“陷阱”。
在他看来,应用的关键在于“用”字,能用才有价值。
比如,在被问及百度为什么不做自己的Sora时,李彦宏回应称,Sora和多模态是两码事,Sora本质上是在任意场景下的视频生成能力。这件事非常有意义,与此同时又非常难,可能需要很长时间,而且成本很高。
“我用简单的方法就能够做到,那我为什么不呢?先把这些事儿解决了,让这个应用能够跑起来,这是我们的思路。所以外界有一种误解,百度不做Sora,就等于百度不做多模态。事实上,在真正有应用场景的地方,我们的多模态能力是非常强的。”
从这个角度来看,李彦宏是一个AI现实主义者。
但他也有理想主义的一面。在这届世界大会的One More Thing环节,李彦宏发布了一款将在明年一季度上线的全新AI产品“秒哒”。
这是一款不需要写代码就能将想法变为现实的软件,功能涵盖无代码编程、多智能体协作以及多工具调用等。用户只需要用自然语言交流,就能构建出各种应用。
李彦宏认为,这款软件的意义在于可以让一行代码都看不懂的普通人,具备程序员的能力。当几亿、十几亿人都具备这种能力时,它对创造力爆发(的影响),是辅助代码生成工具没法比的。
“当你的梦想是让几亿人、十几亿人都具备程序员的能力,这个又需要很多年大手笔投入的时候,这难道不是一种理想主义吗?”
在访谈接近尾声时,李彦宏讲起了百度的一段往事。2024年诺贝尔物理学奖得主Geoffrey Hinton曾经差一点加入百度,后来因为他个人更愿意留在美国而加入了谷歌。于是百度找到了另一位当时人工智能领域的大咖吴恩达。
彼时,吴恩达在谷歌做Google Brain(谷歌大脑),想买更多的GPU,谷歌不同意。李彦宏找到吴恩达并告诉他,“你来百度,随便买。”随后,吴恩达加入了百度。
那是2014年,AI还只是一小部分人的理想。