2026年，各车企的自动驾驶方案到了什么阶段（二）？

智驾最前沿

自动驾驶领域专业的技术、资讯分享全媒体平台。我们的slogan是：聚焦智能驾驶，紧盯行业前沿。

点击展示全部

[首发于智驾最前沿微信公众号]之前和大家一起分析了小鹏、华为、特斯拉这3加车企的最新智驾方案（相关阅读：2026年，各车企的自动驾驶方案到了什么阶段（一）？），今天我们带大家来继续看看其他车企有哪些技术革新。

VLA加3D空间理解，理想MindVLA-o1想补上关键短板

理想汽车在2026年3月英伟达GTC大会上发布的MindVLA-o1，试图走一条与传统VLA方案不同的路，即将3D空间理解能力与语言推理能力深度融合，构建面向物理世界的通用智能体。

图片源自：网络

理想汽车基座模型负责人詹锟在发布时明确指出，当前业界VLA方案存在三个关键痛点。3D空间理解与语义推理之间对齐效率不够理想，导致语义理解和行为出现偏差；决策延迟，视觉—语言—行动之间的传递链路过长；长尾场景覆盖不够，仅靠真实数据规模扩展难以覆盖。

MindVLA-o1的解法是多项技术的组合。它采用VLA-MoE（混合专家模型）架构，引入专门的Action Expert（动作专家），从3D场景特征、导航目标、驾驶指令等多维输入中提取信息，结合多模态思考生成高精度驾驶轨迹。在视觉模型层面，采用原生3D ViT编码器，通过视频流直接还原3D空间的位置、点云、语义与像素信息，避免了传统BEV方案将场景压缩为俯视图后丢失高度信息的问题，也解决了OCC占用网络缺少语义信息的缺陷。

这套方案还引入了预测式隐世界模型技术。该模型可以在隐空间中高效模拟未来几秒的场景变化，对于需要预判前车反应、行人动作的驾驶场景而言，这种能力可以显著提升决策的稳定性。理想自研的马赫M100芯片在标准大规模矩阵乘任务上性能较上一代提升3倍，为这套新架构的车规级落地提供保障。

理想将MindVLA-o1定义为面向物理世界的通用智能体，同一套VLA模型可同时控制车辆与机器人，将自动驾驶视为物理AI的发展起点。

用世界模型加闭环强化学习，蔚来押注类人驾驶？

蔚来的技术路线与华为同属世界模型阵营，但落地思路有明显差异。2026年1月，蔚来正式推送了世界模型NWM全新版本，国内首次将完整的闭环强化学习技术融入智能驾驶研发，构建起世界模型+闭环强化学习的技术架构。

图片源自：网络

这套架构的逻辑是让模型通过学习海量人类驾驶行为数据，自主理解道路动态、交通常识与空间关系，以长时序环境推理能力持续校准规划逻辑与执行精度，从而显著降低对高成本人工标注数据的依赖。NWM新版本聚焦选道准、博弈强、控车稳三大方向，优化了导航跟随精度、车流避让响应及动态车道判断能力；提升了变道决策的果断性与人车混行环境中的安全表现；实现了横向与纵向动作的高度协同，加减速更加柔和自然。

NWM新版本推送后首月数据颇为亮眼，智驾使用总里程环比提升81.5%，城区领航辅助使用时长增长81.7%，辅助驾驶里程占比超过50%的用户数增长了115.4%，这也反映用户对新系统的认可度明显提升。蔚来还首次引入了城区领航换电功能，车辆在领航辅助状态下可自动驶入换电站完成换电，支持全国超过2000座二代及以上换电站，打通了补能环节的最后一公里。

百度Apollo，从Robotaxi到功能型无人车

百度Apollo走的是一条技术开源+商业运营双轮驱动的路线。2026年1月发布的Apollo开放平台11.0，聚焦功能型无人车的系统设计，开放了自动脱困、贴边行驶、回库泊车等典型技术应用，可高效服务于快递配送、环卫清扫、安防巡检、园区接驳等场景。这套开源平台已汇聚了26万开发者。

图片源自：网络

在商业运营端，百度旗下的Robotaxi业务萝卜快跑每周全无人订单已超25万单，全球累计服务超2000万次，覆盖北京、上海、武汉等26座城市，是目前全球运营规模最大的自动驾驶出行服务之一。

卓驭科技，一个模型驱动万物智能移动

卓驭科技在2026年北京车展上发布了行业首个原生多模态基础模型，将智能驾驶的发展划分为小模型（感知+高精地图+规则）、中模型（端到端）、大模型（原生多模态）三个阶段。这套新模型在预训练阶段融入了互联网数据、移动机器人数据及多模态信息，目标是实现跨垂类开箱即用，降低车型适配的时间和成本。

图片源自：网络

2026年4月起，卓驭的高悟性端到端4.0模型将通过OTA推送至搭载高通8650与8775芯片的车型；针对更广泛的中低算力平台，搭载TITDA4-VH芯片的车型也将升级至端到端3.0系统。商用车方面，卓驭已与宇通客车达成战略合作，联合开发商用客车NOA智驾方案，搭载激目2.0系统和自研补盲激光雷达。

小米XLA，软硬件全系标配

小米在2026年3月推出了第三代辅助驾驶方案，XLA认知大模型。与之前两代不同，XLA不再仅仅依赖数据模式，而是试图让系统真正理解环境，进行常识与因果推断。

图片源自：网络

在硬件上，新一代SU7全系标配高规格辅助驾驶硬件，700TOPS算力的Thor芯片，配备激光雷达、4D毫米波雷达、11个高清摄像头和12个超声波雷达。软件层面，XLA基于小米自研的MiMo-Embodied具身基座大模型，首次打通辅助驾驶与具身机器人两大任务，实现了两套系统在同一基座模型上的复用。

值得一提的是，小米承诺为初代SU7 Pro/Max/Ultra及YU7全系提供XLA的OTA升级，老款车型无需更换硬件即可体验最新智驾功能，这在行业内并不多见。

最后的话

将这些主流方案放在一起比较可以发现，VLA路线的代表有小鹏、理想和特斯拉（FSD V14的端到端本质上也是这一方向，只不过特斯拉不使用语言中间层）；世界模型路线以华为和蔚来为代表。而在VLA和世界模型的中间地带，卓驭和小米各自在尝试更灵活的兼容路线，卓驭的原生多模态模型试图从预训练层面就融合多种数据模态，小米则用同一套基座模型打通智驾和机器人两大任务。多个玩家，多种解法，2026年的智驾竞赛还远没到统一的终局。