站在2024岁末,重新看量产自动驾驶的发展趋势
创始人
2024-12-19 12:43:43
0

从9月初《量产自动驾驶》出版至今已三月有余。期间诸多亲朋、同学校友、新老同事、业界同行关注到了本书,并帮忙奔走相告、广泛相传,同时也给予了笔者大量的反馈和中肯的建议。在此再次感谢各位的厚爱和支持。该书初稿成于2023年夏天,末章以当时的视角对量产自动驾驶的未来进行了多维度展望。在随后本书长达一年之久的修稿过程中,仅对该章进行了小幅度的补充,并未做系统性更改。一年半以后的今天,行业又发展到了全新的台阶。如今,站在2024岁末,让我们回首过去展望未来,重新看量产自动驾驶的发展趋势。

关于产品

先看产品形态的变化。

Urban的不断深化

目前国内头部的自动驾驶团队均已量产落地了城区导航巡航自动驾驶功能(Urban Navigation On Pilot)。由于无图或弱图技术的使用,该功能被释放到越来越多的用户车上,可支持的城市与日俱增,实际可运行城区道路范围越发广阔。

公开资料显示,截止到2024年10月,蔚来汽车的自动驾驶用户已达到598,875名,高速和城区NOP功能行驶总里程达到1,322,000,000公里,路测总里程达到460,000,000公里以确保交付的功能足够安全可靠。

近两年,其他头部自动驾驶团队同样取得了斐然的成绩,在此不一一举例。可以预见,在接下来的日子里,城区自动驾驶运行范围的扩张能够以月甚至更短的时间为单位迅速扩张。这意味着,在不远的将来,我们将很快看到自动驾驶功能可以实现在任何地方都可用的目标。

点到点功能交付

图1 点到点的自动驾驶功能

城区NOP功能全面铺开之后,一些从业者开始思考如何打通跨场景的自动驾驶功能形态,给用户提供全程连续的自动驾驶体验,即“点到点”。如图1所示,当用户从家出发开启导航并进入自动驾驶模式,NOP功能随导航牵引可以持续运行:从停车位开始启动功能,穿过小区、城区道路、红绿灯路口,驶上高速高架路段,经过匝道和ETC收费站,重新回到城区,进入公司停车场,最终完成泊车入位。由于全流程的两头,车辆都可以处于停车位的位置,“点到点”功能也常常被称为“车位到车位”功能。据了解,行业头部玩家早已开始“点到点”功能的研发测试,预计在接下来的半年内,该功能将从各家车企陆续交付到用户手中。

L3功能量产

量产自动驾驶产品形态已经在L2级别维持了很多年。近两年各家都在争相进行技术储备,希望率先拔得L3的头筹。

根据标准定义,L3级别的自动驾驶是指在限定场景下车辆可以自主行驶,无需驾驶员干预,当系统请求时驾驶员必须接管车辆。到L3级别,不仅是技术的升级,更是行车责任的转换。在L3模式下,行车责任在自动驾驶系统,而不是驾驶员。目前在高速高架路段,头部玩家的自动驾驶接管率已经达到几百或几千公里每次。在非早晚高峰时段,或高速长途行驶场景下,接管率指标会更高。这就给L3功能的实现带来了契机。通过限定设计运行范围(ODD),可量产的自动驾驶系统完全有机会在无需驾驶员干预下自主行驶。典型条件如下所示:天气良好,封闭道路,路面标识标线清晰,路面交通流较稀疏,导航道路前方无汇流和上下匝道的路段,车辆无故障等。

图2 首批获得国家工信部自动驾驶L3测试牌照的企业

L3功能的量产落地除了需要更先进技术的支撑,更依赖法规政策先行。2023年7月,深圳发放了全国首张L3高快速路测试号牌,推动申报国家准入试点。今年各地又相继传来发放L3准入测试牌照的消息,包括北京、上海、重庆、深圳等诸多城市。2024年6月4日,国家工信部网站发布了《四部门有序开展智能网联汽车准入和上路通行试点》的通知,公布了9家首批智能网联汽车准入和上路通行试点联合体,如图2所示。可以预见,在接下来的一年内,国内自动驾驶L3功能定能量产落地。

量产L4一定会来

在自动驾驶萌芽之初,大家都追逐于L4完全无人驾驶的愿景。时至今日,中美两地的L4玩家仍然只能在个别城市很小的限定区域内运营RoboTaxi或小巴,或者在港口、矿山、厂区这类封闭的区域进行货物的搬运。大范围的L4运营看起来仍然遥遥无期。

但技术的迭代是一个加速的过程。横空出世的ChatGPT面世至今才经过短短两年,如今AI领域完全又是一番全新的景象。我们有理由相信在不远的将来量产L4级别的自动驾驶一定会来。但其形态是否为RoboTaxi,在这里我们先预留一个问号。

一般我们看一项新技术是否能在产业里落地的底层逻辑可以分为三层:技术逻辑、商业逻辑、社会逻辑。首先,技术逻辑必须是闭环的。即该项技术具备先进性和完整性,可通过产业的各类应用测试,而不仅仅是一个原型或DEMO。由此,该技术就有了可落地的基础。其次是商业逻辑。在非特种行业的一般民用领域,一项无法产生经济效益的技术是没有生命力的,既无法赋能产业,更无法被市场经济所接受。即使短期内可以获得一些成果,但长期没有源源不断地资金支撑,研发资源无法维持,不能持续对技术进行迭代升级。最后还需要看该项技术的社会逻辑。新的技术能被开发出来,理论上也可以产生不菲的经济效益,但还需要看是否符合当地社会发展的需要。这一点在不同国家和地区是有区别的。以RoboTaxi和RoboTruck为例,在美国地广人稀,车多而劳动力少,无人驾驶出租车和运货车能够有效缓解美国绝大多数地区劳动力短缺的问题。而在我国,目前城市交通拥堵状况日益严重,在私家车之外再增加大量的无人驾驶车辆会显著加剧交通问题。而且在当下,就在我们身边,滴滴司机、外卖配送员、代驾司机、快递员、物流司机等仍然是一个非常庞大的劳动群体。量产L4自动驾驶来临后,高科技和这些庞大劳动群体的分工与合作同样是我们需要深入思考的问题。

“生产力决定生产关系,生产关系对生产力具有反作用,当生产关系适应生产力发展状况时,就会推动生产力发展;反之,就会阻碍生产力发展”言犹在耳,值得我们每一个从业者深思。

关于算法

算法在最近一年多又产生了巨大的变化。

端到端

一年前,端到端(End To End)的算法才刚刚出现在学术领域。今年开始,头部玩家已经实现或正在实现端到端的自动驾驶模型,即算法全面由模型组成,输入为传感器数据,输出为目标轨迹或车辆控制指令,如图3所示。两段式端到端是指感知和规划分别用两个深度学习网络实现,网络之间采用人工定义的矢量化数据传递信息,如车道线3D位置、目标物的3D框、类别、语义等。而一段式端到端则进一步去掉了人工过程,感知和规划之间由隐式的特征数据相连,两段模型组合成一段。

图3 两段式和一段式端到端模型

端到端算法的实现可以带来两个方面的显著收益:

深度学习模型从真实数据中学习处理问题的能力,与人为定义的Ruler Base算法相比,理论上深度学习模型具备更高的性能上限,端到端算法更是如此。端到端阶段更进一步的减少或消除了人为简化上下游算法之间信息的过程,模型自动学习上下游需要传递的特征(Feature)信息。

●深度学习模型通过数据驱动的方式进行性能迭代,该过程可通过工具链实现自动化。端到端算法阶段则能实现自动驾驶算法全流程的自动化迭代,能够极大的提高迭代速度。这比人为优化Ruler Base的数学公式效率要高得多。

那么问题来了,端到端算法就足够好了吗?答案是否定的。

端到端算法能解决信息损失问题和迭代效率问题,但是无法解决Corner case。我们知道,自动驾驶系统一直以来都面临长尾问题。这就意味着,即使有几十或几百万辆量产车在路面跑,从概率学的角度,仍然会有极低概率出现自动驾驶系统处理不了的场景。我们很难获取足够用于模型训练的Corner Case场景数据。必须有其他方法来解决这些低概率问题。量产自动驾驶同行们又将目光投向了学术界,映入眼帘的有两条路:大模型和世界模型。

大模型和世界模型

学术和产业实践都证明,通过采集自动驾驶车辆在路面的行驶数据来训练端到端模型,的确可以得到更智能、更拟人的自动驾驶行车表现。但我们不禁再次思索一个问题:人类是如何学会开车的?

绝大多数人类开车都是从驾校开始的,短短几个课时就能快速具备基本的驾驶能力,并在自己驾车和观察别人驾车的过程中不断吸取经验,持续提高驾驶水平。当我们行走在道路上时,就已经知道要避开行人、避开深坑,驾车的时候不需要人教就具备绕障能力。这意味着,人类在第一次做到驾驶位前,就已经从日常生活中积累了大量的基础知识和技能。这些基础知识和技能我们可以称之为通用能力,它可以在极端时间内使人类经过简单训练就能学会开车这件事情。那么是否可以给自动驾驶系统也赋予通用能力呢?答案是肯定的,多模态大语言模型。

大语言模型通过学习人类大规模语料中的上下文关联关系得到通用的推理能力。此外,人类在日常生活和工作中无形生产了大量的文字和图像、文字和视频相关联的数据,这使得多模态的大语言模型也成为了可能,例如视觉语言大模型(VLM)。多模态指的是大语言模型的输入包含多种形式的数据,即text、图像、以及视频流。人类世界总结的规律绝大多数都以Text和图片的形式保存下来。表象上看该类模型仅通过“上文”为输入,预测高概率的“下文”。然而人类的语料中天然隐含推理逻辑,这类逻辑即为通用能力,可以很自然的被多模态大语言模型所学。开源的多模态大语言模型使得自动驾驶系统面对corner Case时,不再需要去收集低概率场景的数据做模型refine。今年7月,大语言模型加持的自动驾驶系统已经实现量产落地,即DriveVLM。该模型以前向摄像头的图像为输入,先后经过场景描述,场景分析,以及层级规划三个阶段,最终输出行车决策和目标轨迹。

让我们再回到人类开车这件事情上,讲一个亲身体会的例子。前段时间在停车场泊车的时候,由于周围车辆停得很满,且目标车位很窄,我发生了剐蹭事故。事后我在脑海中进行了复盘,想象在当时的场景下应该怎么开能够避免剐蹭。当我再次在停车场面临相同状况时,轻而易举就完成了泊车入位。通过这个例子我们可以看到,人类可以利用自身的想象推演能力学到新的知识。自动驾驶系统同样有机会获得想象推演能力,提供该项助力的即为世界模型。

世界模型以历史帧的观测信息为输入,以自车当前时刻各类候选决策为条件,持续预测一段时间内能看到的未来世界。多维度分析未来世界中自车行驶的安全性、舒适性、合理性,据此选择当前时刻自车的最优决策。理解世界的最高境界是同时在时间维度和空间维度再造世界。如图4所示,在《预见未来》这部电影中,尼古拉斯凯奇饰演的主人公具备一项特殊的能力。他能预测周围环境未来2min内发生的所有可能性,并依托此能力逃脱反派的各种追杀。这就是世界模型之于自动驾驶系统的意义。目前头部少数的玩家已经展开了世界模型的量产落地工作,相信在不久以后就能出现在量产乘用车上,让我们拭目以待。

图4 电影《预见未来》剧照

算法黑盒问题

深度学习模型是一个不可解释的黑盒,其输出结果是一个概率分布,具备不确定性。该类模型在量产车上的广泛使用如何保证安全直到今天仍然争论不休。

在以往的ADAS阶段,为确保车辆行驶安全,需要严格限定软件的输入和输出,详细拆解软件的中间过程,利用功能安全相关方法论分析安全薄弱环节,并在系统设计上采取必要的安全措施。但该类方法面对黑盒的深度学习模型不再适用。那么如此这般,在新的阶段,应该以什么样的视角再度审视安全这件事呢?

ADAS阶段所谓的安全,是以牺牲系统处理能力为代价的。软件运行过程完全可解释,意味着系统可处理的场景很少。那么自然,ADAS能给人带来的价值非常受限。真实的世界本身具有非常强的不确定性,影响因素不胜枚举,场景不可穷尽。在高阶自动驾驶阶段,随着系统要处理的场景越来越多,智能化程度越来越高,要清晰完整解释软件运行的所有过程,其难度不亚于给真实物理世界实现完整细致的建模。让我们再次将自动驾驶系统类比人类,思考下面两个问题。

人类驾驶员是一个白盒,还是一个黑盒?作为乘客,我们为什么会信任一个素未谋面的滴滴司机?

人类是一个典型的黑盒系统。当我们开车时,眼睛看到了前方有个静止的障碍物,下意识踩了一脚刹车,中间大脑的思考过程其实我们完全不清楚。众多的交通事故表明,人类驾驶员并不能在任何情况下都保证万无一失。那为何我们会对一个素未谋面的滴滴司机产生信任?深入分析,发现这些信任来源于潜意识里如下几个方面信息:

滴滴司机有驾驶执照,且在管理平台上得到了认证,有基本保障;

司机的驾龄和服务年限,时间越长越值得信赖;

五星好评度,好评越多越信任;

打到车后,初始的乘坐体验(行车平稳程度),对信心影响最大。

以上信息跟自动驾驶系统的评测过程非常相似,驾照代表了法规测试,驾龄或服务年限代表了测试里程,五星好评度则为测试评价,乘坐体验则跟实车测试过程基本一致。

由此看来一个系统是否为黑盒,并不能作为其安全性的评判标准,充分可信的测试验证或许是证明其安全性的较好途径之一。

关于系统架构

算法越来越丰富,其能力也越来越强。承载着算法的自动驾驶系统架构也在发生着变化。

整车算力集中

在《量产自动驾驶》的第10章中详细论述了当代汽车整车电子电器架构的演变趋势,如图5所示:从基于功能域的架构,经过混合架构的过渡,再演变为基于位置域(Zonal)的架构。现如今,越来越多的量产车都已实现采用Zonal架构。整车的算力面向中央大脑(中央控制器)集中,这不仅意味着整车硬件成本的下降,同时也推动了算力利用率的提升。硬件方面,整车线束和控制器个数得到大幅度缩减,芯片、元器件、壳体、散热系统等复用度显著提高。软件方面,多功能域相关的软件随算力也都集成到中央控制器内,一般包括三个主要部分:整车控制软件、智能座舱软件、以及自动驾驶软件。要想达到高水平的算力利用率,软件系统必定比以往更加复杂。软件系统复杂度的显著提高对研发能力带来更大的挑战,如软件的高效率调度、异构核的交叉应用、多操作系统的隔离和互联、高带宽低时延通信链路的匹配和管理等。

图5 整车架构的演变趋势

芯片算力扩增

自动驾驶系统承载了整车最多的计算任务,量产自动驾驶芯片自然而然成为当前量产车内算力最集中之处。前文中我们可以看到,自动驾驶功能越来越丰富,车端算法越来越复杂,模型越来越大,因此算力需求也随之水涨船高。如图6所示,量产自动驾驶先行者Mobileye的EyeQ系列芯片十年间算力飞速增长。

图6 Mobileye EyeQ系列芯片

目前行业高配车型算力配置基本已达到500TOPS(两颗OrinX)。蔚来汽车则在上一代整车平台全系搭载了1000TOPS(4颗OrinX),在今年已宣布自研的更强芯片流片成功,预计将在下一代整车平台上使用,并于明年实现量产交付。其他各大车企也在纷纷布局自研大算力芯片。算力的扩充,将为接下来几年的量产自动驾驶功能快速演进打下坚实的基础。

传感数据更丰富

目前市面上主流的高配自动驾驶系统传感器方案为:1个前Lidar作为选配(个别车型还会增加两个侧lidar),11个camera(2个前视,4个周视,1个后视,4个环视),1个或5个Radar,12个超声波雷达。由于特斯拉珠玉在前,纯视觉路线和多传感器融合路线尚存在一些争议,低成本的纯视觉方案到底是不是量产的终局?这里做一些针对性的讨论。

对自动驾驶算法来讲,有一个底层逻辑:理论上来说,传感配置越高,输入的观测数据越丰富,模型对周围环境的理解程度应当更高。我们对主流的四类传感器稍作分析,毋庸置疑的是图像尤其是高分辨率的图像,其涵盖的信息量远高于其他类型的传感数据。因此camera理当作为主力传感器而存在,且在很多场景下纯靠camera能处理绝大多数自动驾驶问题。这也是为什么市面上高性价比的车型采用纯视觉方案仍然能提供高级别的自动驾驶功能,如高速高架以及城区的NOP。但是在面对低照度的夜晚、雨雾天、泊车视野盲区等场景时,纯视觉显得捉襟见肘。此时Lidar、Radar、USS的作用将被突显出来。在面向L3和L4进化过程中,对自动驾驶系统场景应变能力的要求将越来越强。

这就好比人类,在日常生活中人对环境的观测绝大多数时依赖眼睛。但我们不要忘了,人还有嗅觉、听觉、味觉、以及触觉,甚至还有第六感。这些感觉和视觉一起,为人构建了一个多维度感知信息的世界。此外,为了扩展眼睛观测的便捷,尽可能突破黑暗屏障,人类为此付出了极大的额外成本。例如:室内照明、城市路灯系统、场馆照明、运输设备各类照明(车辆、飞机、火车、船)等。这意味着,看起来相对低廉的纯视觉自动驾驶解决方案,其成本还有很大一部分在各类照明基础设施上,且该类成本很可能会达到无法想象的巨量规模。

我们有理由相信,在自动驾驶能力不断提升的将来,传感数据定当更加丰富,多模态的传感信息支撑自动驾驶系统将成为必然,批量的应用使得其成本比当前将更加可控。

软件分层迁移

目前国内汽车行业内卷很厉害,降本增效是每一个从业者必须要面对的问题。自动驾驶系统作为整车最重要组成部分之一,其架构从设计上是否还存在优化空间?如图7所示,头部玩家已经开始在论证如何实现自动驾驶软件的分层迁移。

图7 自动驾驶软件分层迁移示意

先看第一层:部分软件从传感器端迁移至中央控制器。该思路在过去十年中已经屡试不爽。十年前的ADAS阶段,自动驾驶功能软件、感知决策算法软件、传感数据处理软件全都集成在传感器端,控制指令则通过车载总线(CAN)传递至底盘。如早期的单Radar单camera组层的 AEB或ACC系统。之后,车企逐渐希望自主开发功能,将功能软件逐步从传感器端迁移至自动驾驶域控制器内,传感器端则提供感知结果。近几年,车企逐渐具备了各类算法研发能力,感知决策算法软件也从传感器端迁移出来,传感器仅提供高质量的传感数据,如图像、激光点云、毫米波点云等。现如今,算力集中的Zonal架构已经量产,中央控制器可以完成更多的计算任务,通信链路带宽更大时延更低,传感数据处理软件将在接下来一两年有机会迁移至中央控制器。该方式主要有三方面的收益:

传感器端的计算任务大幅度减少,可以使用更便宜的芯片,成本有机会得到大幅度下降;

传感数据处理软件运行在中央控制器中,有更丰富的算力资源可用,其理论性能天花板更高;

传感器供应商的软件进入车企的中央控制器,与算法、功能、操作系统等软件统一维护和运行,其迭代效率更高,供应商和车企的合作也将更为紧密。

关于商业模式

说一千道一万,自动驾驶产品和技术的发展虽然足够激动人心,但作为量产赛道的一员,我们仍然要回归商业本质,不断思考量产自动驾驶的高水平技术如何带来高价值回报。简言之,如何把持续高额投入的钱赚回来,并通过规模效应赚到更多的钱,真正代表更先进的生产力,推动生产关系发生良性变革。

高投入低产出的现状

今年开始,我们已经陆续看到有个别自动驾驶公司难以为继或车企自动驾驶团队收缩的消息,身边也逐渐出现小伙伴从自动驾驶行业转投其他行业。究其原因为自动驾驶行业长期高额的研发投入和低效的现金回流所致。这里我们根据国内现状,尝试做一个数学题,简单算算账。

投入现状:国内具备量产全栈软件能力的团队基本需要千人级的规模,每年的研发费高达10~20亿人民币不等。这里主要支出包括人员薪酬福利、车端和云端基础设施建设、数据的生产和运维、以及测试验证等。一般而言,在兵马粮草都具备的情况下,初创团队按照研发规律,两年后才能产出符合量产要求的成果。

产出是什么?对于自动驾驶系统供应商来说,最简单直观的收入是项目开发费(俗称NRE,Non-Recurring Engineering)和按照车辆销量计费的License费用。同理,对于车企的自动驾驶团队来说,其对应的产出是帮助车企节省这两笔费用。先看NRE收入。在两年前,行业里能提供高级别量产自动驾驶全栈方案的供应商极少,单个项目的NRE费用可以达到大几千万,甚至超过1亿人民币的级别。而近年来,由于能输出方案的同行越来越多,NRE费用骤减,甚至出现多家供应商免NRE抢一个车企项目的情况。再看License收入。现状是,高阶自动驾驶功能主要装配在整车单价20万以上的区间,其单辆车License费用为1500元左右。而中低阶功能则主要分布在整车单价小于20万的区间,License费用才几百元。长期来看,装车量越大,单车License费用一定会持续走低。

这里假定一个头部自动驾驶团队,取个均值年投入15亿人民币,每年可以交付3个大项目(效益极好),也就是年NRE收入约3亿人民币。如果要收支平衡,每年License收入需要达到12亿人民币,即装车量达到至少80万辆。考虑到税费等因素,装车量需要接近100万辆。简言之,乐观估计一个头部自动驾驶团队,要想到达温饱自足,每年需要至少新增交付100万量车的高阶自动驾驶系统,于此同时维护和升级所有存量交付的车。纵观同行玩家,除了车企自建的团队外,独立的自动驾驶解决方案供应商看起来离温饱线仍然非常遥远。

接下来看看市场容量。20万以上新能源车辆自动驾驶功能配置比较高,这里我们聚焦于高阶方案做计算。2023年国内20万以上乘用车总销量约为2200万量。其中新能源车自动驾驶功能装车总量约为150万辆。燃油车产销总量比新能源车多,但自动驾驶装车率相对较低,据统计20万以上燃油车自动驾驶装车量约为250万辆。因此,2023年全年高阶自动驾驶全国总装车量约为400万量。

综上所述,可以预见高阶自动驾驶方案装车量还有较大上涨空间,但市场总容量有限。国内当前全建制的高阶自动驾驶研发团队众多,低阶方案商更是数不胜数,“狼队肉少”的局面已然形成。头部团队尚未完全分出胜负,在接下来的淘汰赛阶段,必然会加剧人才和技术整合兼并的过程。整体来看,即使最终剩下3到5支团队存活下来,跟高额的投入相比,也很难有10倍以上的产出。显然,这跟我们对“前沿科技能产生的几十倍上百倍的技术附加值”的认知极不相符。

必须要寻求更好的商业模式。

自动驾驶功能服务化

《量产自动驾驶》第15章的15.4小节对量产自动驾驶商业模式从To Business走向To Customer进行了展望,这里自动驾驶产品不再单纯是整车的一项配置,更是提供给车主用户的一种服务。当自动驾驶功能服务化后,新的商业模式就能产生。接下来让我们站在新的视角,看看如何将服务转化为价值。

第一个问题,什么样的付费形式最为合理?如下分别展开讨论:

按服务次数或里程付费。这里以日常通勤为例来计算。城市中日常通勤,在家和公司间打车费用往返共100元。假设用户自己的车可以提供自动驾驶服务,收费为出租车的五分之一,即为20元/天。那么一个月通勤20天服务费则有400元,4个月即可打平前文讨论的License费用(1500元)。这还不包括周末远行产生的服务费。由此可见,将服务按照更细的颗粒度做拆分,将有机会实现更大的价值。

提供高质量的免费服务,通过其他手段实现商业闭环。站在用户的角度,永远会选择更有性价比的产品或服务。在行业高度内卷的今天,通过服务费的形式变现,并不是一件容易得事情。互联网时代大量案例证明,产品和服务免费才是王道,在积累足够多用户量后通过流量或其他形式再变现。量产车的自动驾驶服务是否可以借鉴?自动驾驶服务和其他的变现渠道或许可以关联,例如车辆维保、保险、补能、积分等体系。这里不做进一步展开,期待从业者一同探索。

第二个问题,什么样的自动驾驶服务可以实现付费价值?此时此刻,量产自动驾驶功能已然被越来越多的人群所接受,自动驾驶已然成为人们在选购新车时考虑的最重要条件之一,但用户为自动驾驶单独付费的意愿并不强。据统计,截止到2023年特斯拉的FSD(Full Self Driving)全球选装率约8%,其中北美14.3%,欧洲8.8%,亚洲0.4%,中国不到2%。可以看到,北美地区比亚洲地区选装率高非常多。这是因为FSD在北美的性能与亚洲地区相比有显著代差。国内同行要想实现自动驾驶服务付费模式的商业闭环,其自动驾驶能力需要至少与特斯拉北美版FSD相媲美。

自动驾驶服务化有较好的商业闭环路径,但是免费的观念在互联网时代已经深入人心,仍然需要从业者一同探索自动驾驶服务与其他变现渠道相结合的可能性。

除服务化之外,自动驾驶是否还有更好的出路?

新的蓝海在哪里

为寻找量产自动驾驶新的蓝海,让我们把目光暂且从汽车行业移开,看向更广阔的地方。

随着人工智能的发展,近两年具身机器人也逐步兴起。自动驾驶与之皆为人工智能浪潮中冲刷出来的明珠。前文我们讲到自动驾驶的核心算法接下来会往通用AI能力方向发展。具身机器人则天然需要具备通用AI能力才有机会落地。不论是商用场景的工厂劳动型机器人,还是家用场景的家用服务型机器人,以往的感知、地图、定位、规划、控制等技术栈已经不再能处理好这些复杂的场景和作业任务。总体来看,具身机器人技术框架的核心组成部分将会是:具备通用推理能力的多模态大语言模型(LLM,MLM,VLM,VLA等),引导推理的思维链(CoT,Chain of Thought),理解世界的世界模型(World Model),端到端的移动模型和操作模型,结构化记忆信息的场景图(Scene Graph),高保真的仿真技术3D GS(Gaussian)等。这些关键技术此处不一一详述,笔者另寻机会专门撰文与大家展开详细讨论。毋庸置疑的是,这些关键技术与自动驾驶同根同源,一脉相承。

相对具身机器人而言,自动驾驶沿结构化道路开车这个任务简洁单一。即使如此,仍然需要大模型、世界模型等通用AI技术的加持,才能带来更加连续、智能、安全的行车体验。在量产的道路上,要想用好这些技术并实现规模化落地,离不开前文所述高昂研发费用的持续投入。兵马未动粮草先行,量产自动驾驶团队这些投入之所以可以维持,得益于每年万亿级别的存量汽车市场。具身机器人则与之不同,虽然未来有无限广阔的前景,但当前并无市场可支撑。那么问题来了,对通用AI能力依赖更强的具身机器人如何走到可规模化落地那一步?

一些具身机器人公司通过约束应用场景降低技术复杂度,着眼于解决工业领域的问题,用机器人取代工人完成作业。绝大多数工厂内的工业流程一致性较差,这意味着对机器人的技术要求很难统一,其结果是很难实现单品的规模效应。标准化较好的汽车工厂和电子件工厂,目前自动化程度本身已经很高了,看起来使用高度智能化的具身机器人意义也不大。另一些具身机器人公司则尝试家庭服务场景,并从简单任务做起,在行业整体智能化水平提升之时再逐步增加可提供的服务类别。这些方式看起来都不足以支撑具身机器人长期可持续的研发投入。

在接下来的日子里,正如前文所述,量产自动驾驶和具身机器人的技术发展方向开始逐步走到一起。既然如此,那么一种看起来更可能的途径是,利用量产自动驾驶的平台积累通用AI技术。当时机成熟时,将这些技术快速赋能到具身机器人,同样的研发成果在新的蓝海里创造更大的价值。依托这种方式,特斯拉已经成为了先行者,国内也有若干车企自动驾驶团队在往该方向尝试(因涉及商业机密,此处不举例)。越来越多的同行开始在该方向上崭露头角,未来产业格局会发生怎样的变化,让我们拭目以待。

道路是曲折的,前景是光明的。

最后用非常喜欢的一句话与君共勉:心之所向,素履以往。

相关内容

热门资讯

辅助透视!wpk微扑克俱乐部(... 辅助透视!wpk微扑克俱乐部(WpK)最新ai辅助黑科技(智能ai辅助)(2021已更新)-哔哩哔哩...
透视肯定!wpk俱乐部有外挂吗... 透视肯定!wpk俱乐部有外挂吗(wpK)最新ai辅助黑科技(智能ai辅助)(2023已更新)-哔哩哔...
透视软件!wpk开挂实锤(wp... 透视软件!wpk开挂实锤(wpK)最新ai辅助黑科技(智能ai辅助)(2020已更新)-哔哩哔哩;1...
透视软件!wpk职业代打(WP... 透视软件!wpk职业代打(WPk)最新ai辅助黑科技(智能ai辅助)(2026已更新)-哔哩哔哩1、...
透视挂!wpk怎么玩胜率高(W... 透视挂!wpk怎么玩胜率高(WPk)最新ai辅助黑科技(智能ai辅助)(2026已更新)-哔哩哔哩;...
透视系统!wpk微扑克外挂事件... 透视系统!wpk微扑克外挂事件(WpK)最新ai辅助黑科技(智能ai辅助)(2023已更新)-哔哩哔...
透视有挂!wpk机器人代打(W... 透视有挂!wpk机器人代打(WPK)最新ai辅助黑科技(智能ai辅助)(2024已更新)-哔哩哔哩;...
透视系统!wpk透视外挂(Wp... 透视系统!wpk透视外挂(Wpk)最新ai辅助黑科技(智能ai辅助)(2023已更新)-哔哩哔哩;所...
透视最新!wpk怎么检测伙牌(... 透视最新!wpk怎么检测伙牌(Wpk)最新ai辅助黑科技(智能ai辅助)(2026已更新)-哔哩哔哩...
透视游戏!wpk微扑克真的(w... 透视游戏!wpk微扑克真的(wpK)最新ai辅助黑科技(智能ai辅助)(2026已更新)-哔哩哔哩暗...