元戎启行周光:必须让AI学会害怕!VLA模型已获5款车型定点

车东西(公众号:chedongxi)
作者 |  张睿
编辑 |  志豪

VLA模型领域又来了一位新玩家。

车东西8月27日消息,日前,元戎启行发布了全新一代辅助驾驶平台——DeepRoute IO 2.0。

元戎启行周光:必须让AI学会害怕!VLA模型已获5款车型定点

▲元戎启行发布DeepRoute IO 2.0

该平台搭载元戎启行自研的VLA(Vision-Language-Action,视觉-语言-动作)模型,融合视觉感知、语义理解与动作决策三大能力,对比传统端到端模型,VLA模型更擅长应对复杂路况。

元戎启行周光:必须让AI学会害怕!VLA模型已获5款车型定点

▲VLA(Vision-Language-Action)模型

据介绍,元戎启行DeepRoute IO 2.0平台以“多模态+多芯片+多车型”适配为核心设计理念,支持激光雷达与纯视觉版本,可面向多种主流乘用车平台开展定制化部署。

元戎启行方面表示,截至目前基于DeepRoute IO 2.0平台已达成5个车型的定点合作项目,首批量产车也即将进入市场。

元戎启行CEO周光表示,“VLA模型融合了语言模型,具备强大的思维链能力,能摆脱传统端到端模型的黑盒难题,并将信息串联、分析,从而推理出因果关系。此外,它天然集成海量知识库,泛化能力更强,能够更好地适应复杂多变的真实道路环境。”

另外,周光还表示,VLA模型的表现目前处于持续提升阶段,但VLA模型的下限已超过端到端上限,未来会越来越好。

一、VLA模型带来4大功能 支持防御性驾驶策略

在此次发布会上,元戎启行展示了其VLA模型的4大功能:空间语义理解、异形障碍物识别、文字类引导牌理解、记忆语音控车。

元戎启行周光:必须让AI学会害怕!VLA模型已获5款车型定点

▲元戎启行DeepRoute IO 2.0平台4大功能

空间语义理解是元戎启行VLA模型的重点能力。该功能可在视野受限的动态或静态盲区环境中(如公交车遮挡、复杂路口、桥洞等)感知潜在风险,主动对盲区进行 “预防性预判”。

元戎启行周光:必须让AI学会害怕!VLA模型已获5款车型定点

▲DeepRoute IO 2.0系统空间语义理解能力

系统可在风险出现前提前减速、稳妥通行,具备拟人化的防御性驾驶策略。周光表示:“必须让AI学会害怕,这才是对安全真正的重视。”

元戎启行周光:必须让AI学会害怕!VLA模型已获5款车型定点

▲DeepRoute IO 2.0系统具备防御性驾驶策略

其余三项能力分别是:异形障碍物识别使系统能够识别并应对如施工锥桶、超载小货车等非结构化障碍;文字类引导牌识别让系统“看懂路标”,可解析潮汐车道、公交专用道等文字信息;记忆语音控车功能支持自然语言指令交互,并逐步学习用户偏好。

元戎启行周光:必须让AI学会害怕!VLA模型已获5款车型定点

▲DeepRoute IO 2.0系统异形障碍物识别能力

此外,元戎启行方面表示,已获得超过10款车型的定点合作,并已经有近10万辆具备城市领航辅助系统的量产车型交付,涵盖SUV、MPV、越野车等多个车型。

元戎启行周光:必须让AI学会害怕!VLA模型已获5款车型定点

▲元戎启行已交付近10万辆具备城市领航辅助系统车型

二、VLA模型幻觉现象已经很少 将拓展至人形机器人

在发布会后,元戎启行CEO周光接受了车东西在内媒体的采访,回答了有关VLA模型等方面的问题,以下是部分重点问题的整理,在不改变原意的情况下有删减。

元戎启行周光:必须让AI学会害怕!VLA模型已获5款车型定点

▲元戎启行CEO周光

1、激光雷达短期仍有其价值

关于特斯拉CEO马斯克提到的“激光雷达会让自动驾驶越来越不安全”的观点,周光表示他认为激光雷达目前对通用障碍物识别仍有重要作用,大模型的知识库能力可以识别很多未知障碍物。

周光相信随着大模型技术的发展,视觉会在感知中扮演越来越重要的角色。短期来看,激光雷达受限于技术发展和数据集的成熟度,仍有其价值,而长期来看,大模型有望逐步解决现在依赖激光雷达的部分任务。

2、VLA模型的研发和训练本身与芯片无关

关于元戎启行VLA模型针对不同芯片平台,在算法和训练上做了哪些优化,周光表示VLA模型的研发和训练本身与芯片无关,训练完成后才会进行部署适配,不同芯片平台主要影响的是工程部署的工作量,并不会改变训练方式或模型架构。

3、VLA模型幻觉现象已经很少

关于VLA模型是否也会出现“幻觉”,周光表示预训练阶段确实可能产生幻觉,但通过后训练对齐技术,已经能极大抑制这一现象。现在主流大模型(如豆包、千问)幻觉现象已经很少,这方面已有较好的解决方案。

4、VLA模型将拓展至人形机器人

关于VLA模型是否会拓展至人形机器人,车用和机器人用的VLA模型是否是同一套,周光表示VLA模型本身是通用架构,不再为特定场景定制。元戎启行年初发布的RoadAGI策略时就表示,未来这一技术可泛化至多种移动场景,包括小区、电梯、办公室等室内外环境。

周光还提到现在很多机器人还依赖遥控或巡线技术,而元戎启行希望能实现真正自主、通用的移动能力。

5、出海的关键在于合规

关于元戎启行在出海方面计划和VLA模型对出海的帮助,周光表示出海的关键在于合规,而随着AI模型正越来越通用化,互联网数据训练的基础模型已具备较强泛化能力,不存在“中国模型只懂中国”的说法。

结语:元戎启行加速VLA模型上车

在发布会上,周光总结道:“10万是一个起点,随着高阶辅助驾驶市场的加速打开,我们相信,像元戎启行这样具备核心技术能力的公司将迎来更大的市场空间。”

未来,元戎启行表示将围绕VLA模型持续拓展应用边界,在乘用车市场加速量产部署的同时,推进基于量产车平台的Robotaxi业务。

另外,元戎启行希望VLA模型在更多可移动智能体上延展复用,逐步实现从单点功能到通用智能体的系统演进。