2026年,各车企的自动驾驶方案到了什么阶段(二)?

点击展示全部

[首发于智驾最前沿微信公众号]之前和大家一起分析了小鹏、华为、特斯拉这3加车企的最新智驾方案(相关阅读:2026年,各车企的自动驾驶方案到了什么阶段 (一) ?),今天我们带大家来继续看看其他车企有哪些技术革新。

VLA加3D空间理解,理想MindVLA-o1想补上关键短板

理想汽车在2026年3月英伟达GTC大会上发布的MindVLA-o1,试图走一条与传统VLA方案不同的路,即将3D空间理解能力与语言推理能力深度融合,构建面向物理世界的通用智能体。

图片源自:网络

理想汽车基座模型负责人詹锟在发布时明确指出,当前业界VLA方案存在三个关键痛点。3D空间理解与语义推理之间对齐效率不够理想,导致语义理解和行为出现偏差;决策延迟,视觉—语言—行动之间的传递链路过长;长尾场景覆盖不够,仅靠真实数据规模扩展难以覆盖。

MindVLA-o1的解法是多项技术的组合。它采用VLA-MoE(混合专家模型)架构,引入专门的Action Expert(动作专家),从3D场景特征、导航目标、驾驶指令等多维输入中提取信息,结合多模态思考生成高精度驾驶轨迹。在视觉模型层面,采用原生3D ViT编码器,通过视频流直接还原3D空间的位置、点云、语义与像素信息,避免了传统BEV方案将场景压缩为俯视图后丢失高度信息的问题,也解决了OCC占用网络缺少语义信息的缺陷。

这套方案还引入了预测式隐世界模型技术。该模型可以在隐空间中高效模拟未来几秒的场景变化,对于需要预判前车反应、行人动作的驾驶场景而言,这种能力可以显著提升决策的稳定性。理想自研的马赫M100芯片在标准大规模矩阵乘任务上性能较上一代提升3倍,为这套新架构的车规级落地提供保障。

理想将MindVLA-o1定义为面向物理世界的通用智能体,同一套VLA模型可同时控制车辆与机器人,将自动驾驶视为物理AI的发展起点。

用世界模型加闭环强化学习,蔚来押注类人驾驶?

蔚来的技术路线与华为同属世界模型阵营,但落地思路有明显差异。2026年1月,蔚来正式推送了世界模型NWM全新版本,国内首次将完整的闭环强化学习技术融入智能驾驶研发,构建起世界模型+闭环强化学习的技术架构。

图片源自:网络

这套架构的逻辑是让模型通过学习海量人类驾驶行为数据,自主理解道路动态、交通常识与空间关系,以长时序环境推理能力持续校准规划逻辑与执行精度,从而显著降低对高成本人工标注数据的依赖。NWM新版本聚焦选道准、博弈强、控车稳三大方向,优化了导航跟随精度、车流避让响应及动态车道判断能力;提升了变道决策的果断性与人车混行环境中的安全表现;实现了横向与纵向动作的高度协同,加减速更加柔和自然。

NWM新版本推送后首月数据颇为亮眼,智驾使用总里程环比提升81.5%,城区领航辅助使用时长增长81.7%,辅助驾驶里程占比超过50%的用户数增长了115.4%,这也反映用户对新系统的认可度明显提升。蔚来还首次引入了城区领航换电功能,车辆在领航辅助状态下可自动驶入换电站完成换电,支持全国超过2000座二代及以上换电站,打通了补能环节的最后一公里。

百度Apollo,从Robotaxi到功能型无人车

百度Apollo走的是一条技术开源+商业运营双轮驱动的路线。2026年1月发布的Apollo开放平台11.0,聚焦功能型无人车的系统设计,开放了自动脱困、贴边行驶、回库泊车等典型技术应用,可高效服务于快递配送、环卫清扫、安防巡检、园区接驳等场景。这套开源平台已汇聚了26万开发者。

图片源自:网络

在商业运营端,百度旗下的Robotaxi业务萝卜快跑每周全无人订单已超25万单,全球累计服务超2000万次,覆盖北京、上海、武汉等26座城市,是目前全球运营规模最大的自动驾驶出行服务之一。

卓驭科技,一个模型驱动万物智能移动

卓驭科技在2026年北京车展上发布了行业首个原生多模态基础模型,将智能驾驶的发展划分为小模型(感知+高精地图+规则)、中模型(端到端)、大模型(原生多模态)三个阶段。这套新模型在预训练阶段融入了互联网数据、移动机器人数据及多模态信息,目标是实现跨垂类开箱即用,降低车型适配的时间和成本。

图片源自:网络

2026年4月起,卓驭的高悟性端到端4.0模型将通过OTA推送至搭载高通8650与8775芯片的车型;针对更广泛的中低算力平台,搭载TITDA4-VH芯片的车型也将升级至端到端3.0系统。商用车方面,卓驭已与宇通客车达成战略合作,联合开发商用客车NOA智驾方案,搭载激目2.0系统和自研补盲激光雷达。

小米XLA,软硬件全系标配

小米在2026年3月推出了第三代辅助驾驶方案,XLA认知大模型。与之前两代不同,XLA不再仅仅依赖数据模式,而是试图让系统真正理解环境,进行常识与因果推断。

图片源自:网络

在硬件上,新一代SU7全系标配高规格辅助驾驶硬件,700TOPS算力的Thor芯片,配备激光雷达、4D毫米波雷达、11个高清摄像头和12个超声波雷达。软件层面,XLA基于小米自研的MiMo-Embodied具身基座大模型,首次打通辅助驾驶与具身机器人两大任务,实现了两套系统在同一基座模型上的复用。

值得一提的是,小米承诺为初代SU7 Pro/Max/Ultra及YU7全系提供XLA的OTA升级,老款车型无需更换硬件即可体验最新智驾功能,这在行业内并不多见。

最后的话

将这些主流方案放在一起比较可以发现,VLA路线的代表有小鹏、理想和特斯拉(FSD V14的端到端本质上也是这一方向,只不过特斯拉不使用语言中间层);世界模型路线以华为和蔚来为代表。而在VLA和世界模型的中间地带,卓驭和小米各自在尝试更灵活的兼容路线,卓驭的原生多模态模型试图从预训练层面就融合多种数据模态,小米则用同一套基座模型打通智驾和机器人两大任务。多个玩家,多种解法,2026年的智驾竞赛还远没到统一的终局。

声明:本文由太平洋号作者撰写,观点仅代表个人,不代表太平洋汽车。文中部分图片来源网络,感谢原作者。
2033
05-04
分享
发表您的看法…
半价购
分享