L4公司,凭啥做得好L2/3?

车东西(公众号:chedongxi
作者 |  晓寒 木米
编辑 |  肖涵

2022上半年,自动驾驶行业最热门的趋势就是L4公司扎堆做L2/3一事。

量产自动驾驶赛道十分火热。据互联网数据中心IDC此前发布的《中国自动驾驶乘用车市场数据追踪报告》,2022年第1季度国内L2级自动驾驶在乘用车市场的新车渗透率高达23.2%。可以说,L2/3级量产自动驾驶市场正在进入快速发展阶段,广阔的市场前景无疑是吸引各大玩家入场的重要因素之一。

但对于L4公司转向量产自动驾驶赛道,场内却是众说纷纭。有人说是“降维打击,也有人说是“不得已而为之。那么究竟L4公司做量产自动驾驶到底如何?

总结来看,业内对于L4公司转向L2/3持反对声音的,无外乎是称L4公司缺乏量产经验,工程能力不足。同时还需要面对L4算法迁移至L2/3平台时难以匹配等问题。

但随着文远知行宣布与全球最强Tier 1博世合作打造L2+系统,工程化问题迎刃而解,同时L4公司在感知、预测、决策等自动驾驶关键模块上的优势也更加凸显

可以说L4公司降维做L2/3的优势正在逐步显现出来。

一、 L2/3的核心仍是技术

过去一段时间,一些观点在提及L4公司转向量产的L2/3自动驾驶赛道时,工程能力似乎是摆在L4公司面前的一座难以逾越的大山。

诚然,过去专注于全无人自动驾驶目标的L4公司,往往少有机会去与主机厂做量产交涉,工程经验的缺乏,自然难以积累相应的工程能力。

具体来看,工程能力的短板,让这些以高阶人才为主的L4公司们难以承担逐个对接车厂的高昂人员配置成本、和应对大规模量产中成本控制等难题。

这些,确确实实是L4公司们在去做量产的L2/3级自动驾驶产品时遇到的问题之一。

L4公司,凭啥做得好L2/3?

▲文远知行Robotaxi

但面对工程难题,实际上L4公司们已经毫不避讳,并且找到了一条合作共赢的路——比如已经与宇通深度合作2年多,积累了不少工程经验的文远知行,在今年4月官宣与博世战略合作,共同打造面对世界的L2/3量产产品。

车东西此前在与文远知行CEO韩旭交流时,后者直言:“文远知行在工程化、量产化的经验不足,而博世最强的正是工程化、量产化、集成化、品控、流程把控、对接车厂与适配等方面,因此双方可以强强联合,携手推出一款高质量、安全稳定、适合市场需求的高阶智能驾驶系统。

不得不说,文远知行的做法也算是另辟蹊径。但退一步讲,在做L2+量产自动驾驶产品时,所谓的工程问题只是L4公司们要面对的吗?

并非如此。

有业内专家就表示,传统L2所积累的工程经验不能够完全复用至L2+上。因为L2+的技术架构与传统L2并不相同,因此原有的工程能力并非能够完全迁移。

因此我们看到,无论是L4公司“降维去做L2+产品,还是原本的L2公司“升维去做L2+,其实面临的工程挑战都是全新的。

所以,无论是L4降维,还是L2升维,所面临的工程难题的挑战在本质上是没有区别的。而在工程问题随着量产规模逐步铺开,工程经验不断积累而得到解决之前,我们认为上文所提到的文远知行与博世合作的方式应该会是目前自动驾驶公司们在做量产L2+产品时的最优解,同时文远在合作过程中也沉淀了量产工程能力。

从技术本质和全行业的视角来看,自动驾驶系统,最关键技术最有挑战性的仍然是在感知、预测和决策规划方面。与之相比,研发L2+系统面临的工程问题,投入一部分精力和时间一般都可以有效解决。

尤其是在量产自动驾驶系统从高速公路单车道L2,进入到城市点对点的阶段后,对感知、预测和决策规划能力的要求已经高了不只一个数量级。

而在这三大核心方面,L4公司显然都更具优势。

二、L4公司更熟悉激光雷达 融合算法和数据优势很明显

在感知层面,L4公司在Lidar(激光雷达)数据以及多传感器融合方面拥有更加深厚的积累。

在做L2时,早期玩家大多以摄像头+毫米波雷达的方案。摄像头收集到的仅是2D数据,需要通过基于规则的图像算法分析图像中的每个像素,将进行图像分割、物体分类等一系列步骤得到环境信息。进入L2+时代后,头部玩家逐步引入深度学习算法,完成图像分割、转换、物体分类、目标跟踪等一系列步骤,并将其还原成真实的3D场景。

那么这种方案存在的缺点也非常明显——即存在漏检、识别率低、受环境光亮影响大等情况。而任何一个漏检或者速度的错误估计,都有可能造成一次事故。

比如特斯拉多次出现将侧翻倒地的白色卡车当成天空的识别错误、蔚来ES8撞击施工作业车、小鹏P7未识别出侧翻轿车,未减速撞向60km/h正常行驶的空载挂车等。

这些事故的出现均与摄像头+毫米波雷达的方案感知缺陷相关。

L4公司,凭啥做得好L2/3?

▲文远知行无人驾驶小巴

不管是使用基于规则的视觉算法还是使用深度学习技术,视觉在感知外界物体时永远做不到100%准确,甚至经常会出错。而毫米波雷达又存在难以识别静止物体以及空间分辨率不足等缺点。

那么纯视觉方案是不是就一定不行?文远知行副总裁李璇解释,假设将纯视觉方案应用于L4场景,则要求算法达到人脑的复杂度——凭借视觉图像来判断距离、速度、位置、加速度等信息,因此要让纯视觉算法达到这样的深度和精度,其技术道路比多传感器方案更为漫长。

也就是说,基于现阶段的实际条件,多传感器融合方案是更为切实可行的一条路。

当前市场上的L2+功能绝大部分都还只局限在高速场景,纯视觉加毫米波雷达的解决方案承载起来没有问题。然而在各家都计划进军的城市点到点自动驾驶(Urban End-to-End)功能场景之后,需要解决的问题要远复杂于高速场景。

因此从这个角度来看,激光雷达和多传感器融合算法的引入是目前较优的解决方案。在新能源车厂商采用大算力和高线激光雷达预埋上量产车的趋势下,随着激光雷达大量量产和快速降价,多传感器融合方案已逐渐是主流。

传统的L2玩家采用简单的传感器,对数据融合的要求低,或者不进行传感器数据融合。虽然目前部分主机厂已经开始采用激光雷达,但其多传感器融合的算法能力依然是空白,其中较优者也只具备决策层的后融合的能力。

总结来说,这部分玩家的后融合方案基本上是由每个传感器采用独立的感知算法、独立处理生成的目标数据。 

其局限性主要表现为在极端恶劣气候与复杂遮挡等不确定性场景下分别进行单模信息提取后再进行融合决策,这就会导致每个通道信息会有不同层面丢失,很难能够进行多模有效互补与特征提取共享。简单来说,就是每个传感器的单独识别都会有信息丢失,那么在将各传感器的信息融合起来时就会产生一定程度的识别误差。

那么L4玩家凭借深耕L4方案所积累的多传感器前融合+后融合经验,并通过激光雷达收集的多维点云数据,可以更加高效、精确地识别物体的大小、形状、位置、速度、加速度等信息。无论在大算力平台还是非大算力平台,L4公司积累下的know-how和数据都可以发挥作用。

另一方面,L4公司在做L4时经常依赖高精地图来做感知,但L2+产品上车量产后,由于场景覆盖面大大增加,因此车辆也会经常面临缺失高精地图的情况。那么L4公司怎么去解决了这一问题?

李璇介绍,文远知行在这方面是通过在地图模块中利用感知结果动态构建地图,并和离线地图融合的方式去解决这一问题。这样的融合地图可以支持自动驾驶系统在只有简单导航地图或者没有离线地图的情况下依然可以运行。

L2+自动驾驶系统,在感知、预测模块中势必会用到大量深度学习算法,而数据又是训练模型的最佳养料。在激光雷达和多传感器融合数据方面,L4公司直接领先了好几个数量级。

以文远知行为例,目前其积累路测里程超过1100万公里,场景库超过400万,标注3D点云物体超过3.1亿,仿真数据值超过86亿公里。采访中,李璇告诉我们:“车厂客户直接对我们说,文远目前积累的这些数据和背后的算法模型对于他们而言是非常有吸引力的。

三、决策部分引入博弈算法 更适合城市路况

采用融合感知算法、精准识别各种物体只是第一步。紧接着还需要对其他交通参与者的行为进行预测,才能让系统做出最佳的行驶决策。

自成立之初就扎根城市道路的L4公司,通过大量的测试验证和数据积累,在预测方面形成了极强的算法优势。

在预测方面,文远知行已经可以实现端到端对范围内500个不同的物体8秒之后的轨迹进行预测,并对多条输出轨迹中的每条轨迹预测未来秒的运动状态,包括速度和加速度的描述。

有了其他交通参与者的行驶轨迹预测结果,接下来就是要做出准确的驾驶决策了。

L4公司,凭啥做得好L2/3?

▲文远知行无人驾驶货运车

这方面,传统的L2玩家基本上都采用了基于规则的算法,即遵守一定的道路逻辑和交通法规(例如红绿灯、交通标识、车道线、车辆转向灯等),对周遭少量道路使用者可能发生的若干个行为(如右转、直行、换道),根据高概率的回归结果进行回归优化绘制轨迹。

换句话说,这种规则算法是通过计算道路上的已经被占据的空间,而后去大致确定车辆可用的行驶空间。

事实上,这样的做法更适合美国而非中国的道路。比如在美国郊区,其大部分空间是没有其他车或者行人占据的,每台车辆的可用行驶空间其实是非常宽裕的,所以用这种思路去做预判、决策是合适的。

但是对于中国城区道路,特别是中国一线城市的城区道路,实际每辆车的可用空间是极小的。当自动驾驶车辆遇到密集的车流,在没有人主动礼让的情况下是无法实现成功变道插入的,因此就会导致无法通过自动驾驶开到终点。

因此在这种场景下,就要求自动驾驶车可以用一些强硬而留有安全空间的“挤的动作——从车流中挤出空间。

这个“挤就是一个博弈问题:道路上行驶车辆的共同利益都是安全通过,而所有车辆的冲突就是都想先走而节省自己的时间。这种博弈比围棋这种零和游戏更难,因为这是又合作又竞争的博弈。

目前像是文远知行、小马智行等一线L4公司都基于博弈理论打造出了博弈算法,在车辆汇入车流或是无保护左转的场景下表现远超基于规则算法的L2自动驾驶系统。

此外,像是文远知行的L4系统还能够考虑到路上个体意图对于环境带来的影响,并基于此进行预测与博弈,同时也建立了博弈失败时的应对行为,确保无人车驾驶的足够安全。

试想一下,当这套博弈算法运用到文远知行的L2+系统中,显然就是对目前传统L2L2+系统的一种降维打击。

四、精简模型适应量产平台 消费者明年就能买

从前文来看,L4公司的自动驾驶算法,在感知、预测、决策环节都表现出了极大优势。

但一个关键问题是,L4的测试车普遍用了级别更高的机械式多线激光雷达,以及装有多颗大功耗GPU的工控机。在做量产车的L2+系统时,360度机械式激光雷达变成了视角有限的半固态激光雷达,工控机变成了算力有限的嵌入式计算平台。

硬件弱了,还怎么发挥算力优势?

李璇坦言,对于感知和预测的深度学习模型来说,L4L2+迁移过程中的主要挑战就是怎么在低算力的硬件平台上面跑完成更多的任务。

L4公司,凭啥做得好L2/3?

▲文远知行通用技术平台

她表示,文远知行针对这一问题应用了多任务学习模型、量化剪枝,模型编译等技术,实现在低算力的基础上保持依然可用的感知水平。

并且此前文远知行一直在使用股东英伟达各类自动驾驶芯片,对嵌入式平台也非常熟悉。

对于规划控制,L4公司们面临主要的挑战在于受限的算力,以及更少和更不精确的上游输入。

解决算力限制的方法是算法的裁剪,以体量的精简换取算力需求的降低。这一过程涉及到大量琐碎的工程工作,需要根据需求在质量和算力使用上做大量的权衡。

她举了一个例子解释,这就相当于我们用智能手机应用的设计理念,在非智能手机上做一个应用,最后做出来的应用可能界面、外观设计不如智能机上的那么好看,但核心的功能和体验,肯定是比非智能机上的应用要领先一个时代的。

而更少和更不精确的上游输入,则可以理解为自动驾驶系统对外部世界理解的很多“不确定性”。

如何最大程度消除这些不确定性的最好的方法就是将L4系统上才会使用的不确定性计算系统和框架应用在L2+系统上。这样的不确定计算框架可以使车辆行驶时对于未知情况采取适当折衷的对策。

上述一系列做法解决了L4的算法下放到L2+系统上的问题,但还有一个更为关键的问题——L4的公司在算法能力上要明显强于L2的团队。

人员配置上,传统L2玩家的人员构成以工程化团队和一般算法工程师为主,缺乏经验深厚的自动驾驶高阶算法人才——让其在研发更为复杂的城市道路自动驾驶系统时,无法使用足够高级的技术架构和方法。

这也是为什么一直都是特斯拉、蔚小理这样的新造车公司在引领量产自动驾驶功能发展——率先推出NOA自动导航辅助驾驶类的功能,并向着城市NOA进发。

传统车企阵营中,几百款在售燃油车,直到2022年初才有长城的摩卡这一款搭载了NOA类功能(目前零星增加了若干款)。因为大部分传统车企的传统供应商,根本没有做出来这个功能。

最后总结来看,当下正是L4公司入局L2+市场的绝佳机会。

在特斯拉等新势力的带动下,新一代消费者对L2L2+系统的认可度与需求度日益提升。而传统车企的数百款车型在L2+上几乎全是空白,有急迫且海量的装车需求。

L2+以点到点自动驾驶为核心功能,需要新的技术架构才能实现——这正是L4公司所擅长的,此时入局恰逢其时。

至于配合车企需求、解决各种测试验证的问题,交给博世这样经验丰富的Tier1解决就好了。

据介绍,由文远知行和博世联手打造的L2+产品明年就能实现量产装车,这家一线自动驾驶公司,正走在一条由L2+L4双轮驱动的康庄大道上。

“达则兼济天下”,对于文远知行这样的“L4尖子生”来说,将领先的L4技术降维研发L2+系统,不仅能赢得市场和营收,在原本L4的商业版图上进一步拓疆,为用户带来更好的体验;同时也能够通过L2+的大规模应用,在技术层面去验证、甚至完善其L4技术,进一步提升L2+系统的竞争力。这样的正向闭环,让文远知行在自动驾驶的康庄大道上继续双规并进,支持其走到赛道终点——全无人自动驾驶。