自动驾驶迈向场景落地新征程,头部玩家如何淘得“数据真金”?

车东西(公众号:chedongxi)
作者 |  Juice
编辑 |  晓寒

随着汽车四化的深入进行,自动驾驶能力已经成为了企业不可或缺的能力。

在刚刚过去的2021世界人工智能大会上,多个自动驾驶创企和车企都在会场展示出了自己的自动驾驶产品和技术,世界人工智能大会也俨然成为了一个小型车展。

虽然自动驾驶公司们占据了媒体和公众的主要目光,但在这些公司的背后,还站着很多非常重要的技术服务商,而其中AI数据更是自动驾驶不可或缺的养料。

正是海量的高质量AI数据的训练,才让自动驾驶车型能够准确识别到道路上的物体,并且能很好的处理各种长尾场景。

而在今年世界人工智能大会上, 业内TOP 1的AI训练数据服务商云测数据也发布了新一代自动驾驶数据解决方案,通过场景数据库、定制化数据采集标注、数据标注&数据管理平台等服务,一站式解决智能驾驶从研发初期到落地的训练数据需求。

那么云测数据这套方案具体包括那些内容呢?有什么优势?对整个自动驾驶行业又能带来什么变化呢?带着这些问题,车东西对云测数据总经理贾宇航进行了一次采访,对这套方案有了更多的认识。

一、自动驾驶飞速发展,离不开路测和数据

汽车行业今年最热的话题莫过于自动驾驶了,无论是可量产的高级辅助驾驶,还是最近落地火热的L4级自动驾驶方面都有很大的进展。

在量产车上,特斯拉已经推出了最新版的FSD系统,开始在城市道路上测试了,从海外网友的反馈来看,这一系统的表现还不错。

自动驾驶迈向场景落地新征程,头部玩家如何淘得“数据真金”?

▲特斯拉最新版FSD的UI界面

而国内方面,新造车三强都已经开始推出高速自动驾驶系统了,蔚来已经推出了支持高速自动驾驶的NOA系统,小鹏汽车同样也推出了支持高速自动驾驶的NGP功能,并且还在今年完成了从广州到北京的长途自动驾驶测试,而理想的NOA功能也将会9月份之前推送。

而在更高级别的自动驾驶方面,今年最突出的则是落地潮和去安全员这两个趋势。国内的头部玩家百度小马智行文远知行等都开始增加了落地的城市,并且自动驾驶技术也开始更多的为社会服务,比如在疫情期间为封闭区域输送物质。

可以说,自动驾驶技术在今年进一步的接近了居民的生活,这也跟背后的技术发展分不开。

但技术的不断突破也跟背后的数据量分不开。举个例子,在L4级自动驾驶领域,Waymo是公认的第一名,这并非是因为其车辆足够多或商业化进展比较迅速,而是因为其庞大的路测数据量。

自动驾驶迈向场景落地新征程,头部玩家如何淘得“数据真金”?

▲Waymo的无人车在街头采集数据

公开信息显示,目前Waymo的路测里程已经超过了3000万公里,这在所有自动驾驶企业中是独一份。

国内自动驾驶的领头羊百度的实际路测里程也已经超过了1000万公里,而头部的几家自动驾驶创企如小马智行、文远知行的路测里程已经在600万公里左右了。

自动驾驶迈向场景落地新征程,头部玩家如何淘得“数据真金”?

▲小马智行自动驾驶出租车车型

可以说,在当下的自动驾驶产业,企业的实际路测数据量已经是企业自动驾驶技术的重要衡量指标。

二、术业有专攻,AI数据训练服务商更有优势

虽然自动驾驶车辆在道路上就能够收集到一定的数据,但并不是所有的数据都能直接转化为自动驾驶技术所需要的数据。

举个例子来说,自动驾驶企业收集数据就像早期淘金工人们收集到的沙金,里面有沙有黄金,只有将沙淘去,得到的才是黄金。同理,自动驾驶企业也需要将收集到数据进行标注和筛选,将废料淘汰掉,得出最有用的数据。

但对数据的标注和筛选的过程并不简单,甚至还需要耗费大量的人力物力财力才能完成。因而,很多自动驾驶企业和车企都选择将这一工作交给更加专业的企业来做。

云测数据就是一家这样的企业,在今年的世界人工智能大会上,云测数据正式发布了新一代自动驾驶数据解决方案,为自动驾驶项目从研发初期到落地提供了一站式的数据解决方案。

自动驾驶迈向场景落地新征程,头部玩家如何淘得“数据真金”?

▲云测数据新一代自动驾驶数据解决方案

这套方案主要包括场景数据库、定制化数据采集标注、数据标注&数据管理平台等服务。具体来看,云测数据搭建了一套基础的数据集,包括了车内智能驾舱产品数据库和车外场景产品数据库。

在数据库内完成数据的采集只是第一步,对所采集到的数据中的关键的物体如车辆、行人、车道线等进行标注才能进一步供深度学习算法使用。

为此,云测数据自主研发了数据标注平台,目前已经发展到了4.0版本,覆盖所有自动驾驶所需要的2D/3D等不同类型的标注工具,可满足各种数据标注需求且配置灵活,累计在智能驾驶领域标注2D/3D数据已达数亿帧。

云测数据方面认为在数据标注上,通过算法+人力的标注方式可确保数据标注准确率。所以云测数据从一开始就建立了自己的数据标注基地,目前在北京、山东和河南等地都已经建立了数据标注基地,结合自研的数据标注平台进行高质量、高效率的数据标注服务。

自动驾驶迈向场景落地新征程,头部玩家如何淘得“数据真金”?

▲云测数据房山办公区

在人员分配方面,还明确了标注员、质检员、项目经理来进行分工,同时还制定了一套包含任务分配、需求分析、需求确认、数据清洗、试标确认、进度控制、质量保障等完整的作业流程体系,在保证数据准确率的同时还能够有效保证标注的效率。

云测数据方面还研发了一套专注于自动驾驶的标注工具集,包括了点云融合跟踪、点云语义分割、图像全景分割等,还研发了点云智能贴合、点云多帧复制、多边形切割、全景分割覆盖标注等智能辅助工具。

自动驾驶迈向场景落地新征程,头部玩家如何淘得“数据真金”?

▲云测数据开发的自动驾驶标注工具集(部分展示)

此外,云测数据这套标注平台也支持功能定制,可以与各类系统对接,灵活配置,支持私有化部署在企业本地,客户可以在企业内网组织员工或外包人员进行数据标注工作。

对于比较复杂的项目,云测数据方面还会有专家人才驻场,帮助企业完成数据标注的工作。

正因为如此,云测数据通过标注平台将全流程优化,可助力AI数据训练过程综合效率提升200%,标注流程质量把控,数据标注最高精度99.99% 。

云测数据还有全方位的数据安全和隐私保障能力,多重措施满足企业对于数据安全的诉求,帮助企业构建核心数据壁垒。

凭借着过硬的技术实力,云测数据目前已经和国内多个知名的汽车厂商、自动驾驶公司建立了合作关系。

三、助力自动驾驶技术发展,推动产业落地

通过上面的介绍,不难发现,云测数据的这套解决方案真正可以帮助自动驾驶产业落地。

目前对于自动驾驶落地来说,Conner Case是一个急需解决的问题,但在实际的测试过程中,车辆无法预测道路上究竟会发生什么情况,很多场景都无法覆盖到。另一方面来说,如果在公开道路上突然出现预测之外的场景,也存在一定的安全隐患。

云测数据的场景数据集就很好的解决了这些问题,对各种场景进行全方位的模拟,将时间、天气等因素都充分的考虑进来,能够收集到更多的数据。而有了这些高质量的数据的训练,自动驾驶企业也能够更好的突破一些场景的限制。

但除了能够很好的解决Conner Case之外,云测数据的这套方案还提升了数据标注的效率和准确度,能够给企业带来一站式的服务。

自动驾驶迈向场景落地新征程,头部玩家如何淘得“数据真金”?

▲云测数据的数据标注最高精度可达99.99%

按照贾宇航的说法,用户在选用了云测数据的新一代自动驾驶解决方案之后,大幅提升了数据标注的能力,从而降低了开发周期,这样做除了能够提升企业开发的效率之外,也帮助企业节省了大量的开发资金。

这套方案的作用不仅仅能够体现在企业端,自动驾驶技术发展的最终目的都是为了服务乘客。云测数据能够给自动驾驶企业提供足够多的高质量训练数据,这样带来的直接变化就是企业的自动驾驶技术会有非常明显的提升。

具体到产品上,用户在体验自动驾驶车辆或在量产车上体验高级辅助驾驶功能的时候,车辆本身能够对很多复杂的场景进行处理,这对于用户来说将会是一个非常好的使用体验。

正因为如此,高质量的数据解决方案,将会推动自动驾驶技术的不断落地。