车东西6月11日消息,元戎启行的CEO周光出席了2025年火山引擎Force原动力大会,宣布公司将与火山引擎合作,基于豆包大模型共同研发VLA等前瞻技术,致力于打造物理世界的智能代理。
周光还透露,元戎启行的VLA模型计划于2025年第三季度面向消费者市场推出,并介绍了该模型的四大核心功能:空间语义理解、异形障碍物识别、文字引导牌理解和语音控车,这些功能将在量产后逐步释放。

周光表示,VLA模型的四大功能相当于为智能汽车增加了“透视眼”、“百事通”、“翻译官”和“应答灵”等特性,使其能够更全面地理解驾驶环境,并准确预测潜在的驾驶风险,从而显著提升辅助驾驶的安全性。
1、空间语义理解:VLA模型可以全面分析驾驶环境,识别如桥洞通行和公交车遮挡视野等可能导致的盲区风险。例如,在没有红绿灯的路口,VLA模型能够提前识别“注意横穿,减速慢行”的指示牌,并在公交车减速时推测前方可能有行人,做出相应的减速决策。
2、异形障碍物识别:VLA模型通过互联网快速获取知识,建立了自己的驾驶知识库,能够准确识别各种障碍物并判断潜在危险。例如,它可以识别超载的小货车,并根据路况决定是否减速绕行。
3、文字引导牌理解:搭载VLA模型的智能汽车不仅能够识别道路标识,还能理解其背后的通行规则。在复杂路况中,VLA模型能够解析动态规则,如左转待行区和可变车道,帮助车辆选择合适的行驶路径。
4、语音交互控车:VLA模型使得智能汽车能够与用户进行高效的语音交流,依据语音指令做出相应的驾驶决策。当用户的意愿与导航信息发生冲突时,VLA模型会优先考虑用户的指令。

目前,元戎启行已完成VLA模型的实际道路测试,预计今年将推出超过五款搭载该模型的智能汽车。VLA模型支持激光雷达方案与纯视觉方案,初步将搭载在NVIDIA Drive Thor芯片上,未来将通过技术优化适配更多芯片平台。
火山引擎汽车总经理杨立伟表示,元戎启行在VLA模型的推出上处于行业前列,展现了对人工智能的深刻理解。火山引擎作为领先的云服务提供商,期待与元戎启行合作,推动基于豆包大模型的物理世界智能代理的应用,助力智慧出行领域的创新发展。
周光最后强调,VLA模型作为先进的AI技术,能够连接视觉、语言和动作等多种模态,打通物理世界与数字世界的壁垒,具备完善的任务规划和执行能力,是实现物理世界智能代理的关键技术。他表示,元戎启行期待与火山引擎的合作,推动双方技术在各个领域的落地应用。