专访商汤绝影王晓刚:生成式智能驾驶与AI座舱的进化论​
创始人
2025-05-15 17:00:48
0

随着辅助驾驶普及的不断深入,公众越来越关注驾驶系统的安全性,期待辅助驾驶带来更安全也更流畅的智慧出行体验。只是许多辅助驾驶方案在遇到新场景时难以妥善处理,事故时有发生,暴露出当前技术方案的诸多瓶颈。然而,人工智能技术的发展和进步推动着智能驾驶的演进。例如,商汤绝影2022年发布了行业首个感知决策一体化的智驾通用模型UniAD,并荣获CVPR 2023最佳论文,引领了智能驾驶行业的创新潮流,智驾进入到端到端时代,模型学会类人交互,性能表现大幅提升。那么人工智能技术是否未来还会对智驾的进步起到什么决定性作用,我们对商汤绝影创始人王晓刚先生进行了专访。

智驾革命:从模仿人类到超越人类的世界模型

在智能驾驶的深水区竞赛中,行业正面临根本性范式转移。商汤科技联合创始人、绝影智能汽车事业群总裁王晓刚在接受专访时指出:自动驾驶正从端到端的'模仿学习'迈入'生成式智能驾驶'时代,其颠覆性不亚于GPT对自然语言处理的革新。

这一判断直击行业两大核心痛点:数据质量瓶颈与安全确定性难题。当前主流的端到端模型,本质上是通过海量人类驾驶数据模仿驾驶员行为,但王晓刚揭示了致命缺陷:我们收集的90%数据,恰恰是普通司机在复杂场景中的犹豫或错误决策。当系统学习的是人类的'平均分',就无法突破安全上限。

这种困境在极端场景尤为突出。以无保护左转为例,传统模型需要收集数万个相似案例,但现实中危险场景不可复现,且人类处置方式参差不齐。商汤的破局之道来自其双料冠军技术——连续两年斩获Waymo挑战赛冠军的开悟世界模型。该技术通过物理引擎构建3D交通环境数字孪生,结合强化学习实现百万次虚拟试错。就像AlphaZero自创围棋定式,我们的系统能在虚拟世界中探索出人类从未设想过的安全策略。王晓刚以某量产项目为例:在夜间暴雨场景中,世界模型生成的1.2万种变道策略,使得自动紧急避让成功率提升47%,决策延迟降低至83毫秒。

对于小鹏汽车提出的云端大模型+车端蒸馏方案,王晓刚认为这印证了行业共识:未来智能驾驶研发将呈现'云端重投入、车端轻量化'趋势。但真正的技术制高点在于世界模型的精确度——它必须像物理定律般严谨,又能像生物进化般自适应。商汤的解决方案中,每1个真实场景可生成8000个衍生场景,模型迭代效率提升400倍,云端训练成本降低60%。

智舱进化:从工具到家庭成员的灵魂革命

当行业热议大模型上车时,王晓刚犀利指出症结所在:简单移植云端大模型,只会让车机变成话痨。真正的突破在于重构多模态交互逻辑,实现'一句顶万句'的情感穿透力。

在商汤新一代SenseAuto-Chat系统中,三个技术支点正在重塑体验范式:

无痕身份认知系统:通过动态人脸识别与声纹融合,无需用户注册即可构建数字身份画像。当某车企高管首次进入测试车时,系统自动关联其公开演讲内容,主动探讨舱驾融合的技术边界,展现出堪比私人助理的认知深度。

群体智慧交互引擎:支持8人实时自然对话,能理解座舱内碎片化讨论并智能介入。在家庭出行场景中,系统可捕捉儿童想看熊猫的随意对话,自动规划成都大熊猫基地路线,同步推送科普视频到后排屏幕。

3D视线元宇宙:通过亚毫米级眼球追踪与场景语义理解,驾驶员注视充电桩2秒即可触发自动泊入,凝视广告牌3秒自动推送品牌信息。更革命性的是,该技术与智驾系统深度耦合——当系统检测到驾驶员持续关注右侧来车时,会主动增强该方向传感器权重,实现人机协同决策。

真正的智能座舱要像家人一样'懂得'与'记得'。王晓刚演示了记忆系统的进化:系统将日常对话转化为2048维记忆向量,当用户某次抱怨加班头痛后,再次夜间行车时会主动调暗灯光、播放白噪音,并在地图标注途经三甲医院。这种润物细无声的共情能力,正在重构人车关系。某新势力品牌的用户调研显示,搭载该系统的车主平均每日主动唤醒车机23次,较传统系统提升5倍,情感依赖度评分达8.7分(满分10)。

数据博弈:99%人类数据该被抛弃吗?

针对地平线余凯人类驾驶数据价值有限的观点,王晓刚给出了辩证解读:在L2向L3跃迁阶段,高风险场景的优质数据依然珍贵。但世界模型的价值在于,它能像驾校教练般无限复现危险场景,通过强化学习探索比人类更优的通过策略。

商汤构建了独特的数据飞轮:量产车收集的真实问题场景,经过世界模型生成百万级衍生场景,再通过云端训练反哺车端模型。在与某车企合作的自动泊车项目中,该系统将狭窄车位泊入场景扩展出12万种变体(包括购物车碰撞、儿童突然出现等),使得泊车成功率从87%提升至99.3%,回退率下降90%。

更具战略意义的是数据安全机制的突破。通过联邦学习框架,商汤实现了数据可用不可见:车企数据不出本地,通过加密通道提取特征值参与模型训练。这种模式已吸引3家跨国车企加入生态,其中某欧洲品牌借此快速适配中国复杂路况,研发周期缩短11个月。

生态布局:AI OS重构汽车产业价值链

面对软件不赚钱的行业魔咒,商汤亮出了驾舱云三位一体的破局之策。最新发布的行业首个车载AI OS(千机系统),将大模型能力下沉至车机内核:

MOE架构革命:在10TOPS算力芯片上流畅运行70亿参数模型,通过专家网络动态分配,语音交互能耗降低67%;

智能体商店:开放300个API接口,第三方开发者可开发旅游达人健康管家等场景化智能体,某母婴品牌借此推出儿童情绪安抚应用,上车首周使用率达38%;

混合现实引擎:结合AR-HUD与SLAM定位,在挡风玻璃投射虚拟导游形象,某文旅集团测试显示,游客停留时间延长22分钟,二次消费提升130%。

在出海战略中,商汤的技术正成为破局关键。针对2026版ENCAP新规,其3D视线追踪方案帮助某国产车型在Euro NCAP测评中斩获历史最高分。更巧妙的是文化适配能力:在中东市场,系统会自动规避女性语音指令;在东南亚则强化雨季路况预警。某自主品牌借助该体系,在泰国市场首月订单突破5000辆,溢价能力比竞品高8%。

未来之战:L3落地与责任重构

当被问及L3落地前景时,王晓刚展现了技术乐观主义:世界模型解决的不仅是技术问题,更是责任划分难题。当系统能明确告知'我能处理哪些场景,何时需要接管',法律与商业的齿轮才能真正咬合。

商汤的解决方案中引入数字黑匣子概念:系统实时记录驾驶决策链,包括世界模型生成的128种备选方案及其概率分布。在某个高速公路案例中,这套机制成功证明系统提前发出接管请求,帮助车企规避了巨额赔偿风险。

更深远的影响在于产业价值重构。某分析师测算,商汤的技术体系可使车企软件毛利率提升至68%,是硬件业务的2.3倍。这种改变正引发链式反应:某传统车企将电子电气架构研发团队削减60%,转而投向AI模型训练;某电池巨头则跨界投资虚拟场景生成工具,寻求供应链协同创新。

汽车产业的寒武纪大爆发

在这场生成式AI引发的智驾革命中,王晓刚勾勒出清晰的演进路径:2024年是世界模型验证年,2025年进入场景生成工业化阶段,2026年或将迎来L3级商业落地潮。但比技术突破更深刻的,是对汽车本质的重新定义——从载具进化为有记忆、会思考的移动生命体。

当被问及终极愿景时,王晓刚给出诗意回答:未来的汽车会像老友般理解你的沉默,像导师般弥补你的疏忽,像家人般守护你的脆弱。这不是科幻,而是正在发生的现实。 在这场重构人车关系的史诗级变革中,中国科技公司正站在浪潮之巅。

相关内容

热门资讯

三分钟了解!牌乐门如何拿到好牌... 三分钟了解!牌乐门如何拿到好牌(透视)其实真的有挂(2022已更新)(哔哩哔哩);一、牌乐门如何拿到...
最新技巧(来玩app德州)竟然... 1、最新技巧(来玩app德州)竟然真的有外挂(透视)熊猫互娱平台辅助器(详细教程)-哔哩哔哩。2、熊...
分享认知(WPK)果真真的有挂... 分享认知(WPK)果真真的有挂(透视)青龙大厅牛牛透视辅助(详细教程)-哔哩哔哩科技教程也叫必备教程...
分享实测(微扑克有辅助的)外挂... 相信很多朋友都在电脑上玩过微扑克有辅助的吧,但是很多朋友都在抱怨用电脑玩起来不方便。为此小编给大家带...
重大通报(pokerist)原... 1、重大通报(pokerist)原来真的有外挂(透视)八闽十三张辅助器(详细教程)-哔哩哔哩2、进入...
总算了解(红龙扑克)的确真的有... 1、每一步都需要思考,不同水平的挑战会更加具有挑战性,玩起来才会令人上瘾;2、在更多的关卡中想办法取...
盘点一款(fishpoker大... 盘点一款(fishpoker大菠萝)竟然真的有挂(透视)闲来十三水有外挂的(详细教程)-哔哩哔哩;闲...
技术分享(WPK app)发牌... 大家肯定在之前发牌机制或者发牌机制中玩过技术分享(WPK app)发牌机制(透视)外挂透明挂辅助系统...
必备科技!德扑赔率胜率计算(透... 必备科技!德扑赔率胜率计算(透视)原来真的有挂(2020已更新)(哔哩哔哩);小薇(透视辅助)致您一...
2分钟细说!老友十三水辅助软件... 2分钟细说!老友十三水辅助软件(透视)外挂透明挂辅助安装(2023已更新)(哔哩哔哩);wpk透视辅...