车东西(公众号:chedongxi)
作者 | Juice
编辑 | 晓寒
目前的汽车产业中,自动驾驶已经成为了最热门的赛道之一,而在量产自动驾驶领域的竞争更是进入到了白热化的阶段。
一边是快速普及高速领航辅助驾驶,另一边城市领航辅助驾驶争夺赛也到了厮杀前夜。
而在众多自动驾驶企业中,毫末智行无疑是其中最突出的一个。截止2022年底,毫末HPilot搭载车型接近20款,已经成为国内量产自动驾驶的第一名。
并且毫末智行还在高阶智能驾驶领域,如城市领航辅助驾驶(NOH)方面的发展非常迅速,已经完成了软件封板,达到了交付状态,明年将会大规模交付。
在量产自动驾驶方面,毫末智行正在追赶特斯拉,甚至在城市L2方面,将会领先特斯拉开始规模落地。
但值得注意的是,毫末智行的成立时间并不算长,从2019年到今天,仅仅成立了三年多的时间,就成为行业的头部玩家,也不禁让人好奇,毫末智行是如何做到这一切的?
就在1月5日,毫末智行举办了第七届HAOMO AI DAY,在本次活动上,毫末智行董事长张凯、CEO顾维灏介绍了毫末智行的多项技术,展示了毫末智行能够快速发展的核心秘密。
一、国内量产自动驾驶第一 首个技术出海企业
在这短短的三年时间内,毫末智行的发展速度有目共睹,尤其在量产车领域取得了非常突出的成绩。
毫末智行在2021年5月份首次实现HPilot 1.0版本的量产,具备高速辅助驾驶系统,并首次搭载到魏牌摩卡车型。
同年,HPilot陆续搭载在坦克300城市版、魏牌拿铁、魏牌玛奇朵、哈弗神兽等车型,量产规模破万台车。
2021年底,HPilot 1.0版智慧领航辅助驾驶系统NOH(高速)量产,并成功上车魏牌摩卡车型。而2022年4月份,毫末智行量产了HPilot 2.0版,并搭载在坦克500车型上。
官方数据显示,截止2022年底,毫末智行的辅助驾驶系统毫末HPilot已经搭载了将近20款车,用户辅助驾驶行驶里程突破2500万公里。
目前虽然多个车企和自动驾驶方案供应商都在加速辅助驾驶系统上车,但大多聚焦在少数几款车型中,远不及毫末智行的上车规模,按照规划,毫末智行预计未来两年内将会装车百万辆。从这点来看,毫末智行无疑已经成为国内量产自动驾驶的第一名。
▲毫末智行稳居国内量产自动驾驶第一名
据介绍,2022年底毫末智行还顺利量产了HPilot 3.0版,城市NOH软件封板,已经达到了交付状态。
更重要的是,毫末智行并非仅在国内发力,对于海外市场的开发也丝毫没有松懈。
在2022年第四季度,毫末HPilot登陆了摩卡欧盟版、欧拉好猫欧盟版,拿铁欧盟版、蓝山DHT-PHEV。而在2022年11月份,300台搭载毫末HPilot的摩卡DHT-PHEV车型已经发往了德国,即将开启交付。
而毫末智行则成为了国内首个实现了技术出海的自动驾驶公司。
毫末智行的产品成功落地海外也跟其深厚的技术能力分不开。在毫末自研的AEB算法的助力下,魏牌、欧拉、坦克的四款车型获得了ENCAP、ANCAP五星安全,在相对陌生的评测体系下还能够取得这样的成绩,足见毫末智行的技术之强。毫末智行也成为了国内自研AEB算法落地海内外的公司。
▲毫末智行是中国首个AEB算法落地海内外的公司
整体来看,毫末智行在量产自动驾驶方面已经走到了前列,上车规模走在了行业内前列,甚至率先实现了技术出海,已经成为国内自动驾驶企业的头部玩家之一。
二、发布国内最大智算中心 训练速度提升百倍
而在本次活动上,毫末智行方面认为经过此前多年的发展,自动驾驶已经度过了硬件驱动为主的1.0时代、软件驱动的2.0时代,进入到了数据驱动的3.0时代。
如何才能够在数据驱动3.0时代率先抢跑呢?答案是超算中心。
自动驾驶车辆在日常的运行和测试过程中会产生大量的数据,而且还需要快速处理产生的数据,这就要求自动驾驶企业需要具备很强的数据处理能力。为此特斯拉直接建设了一个超算中心来处理海量的数据,国内的新造车公司小鹏汽车也建立了自己的超算中心。
在本届HAOMO AI DAY上,毫末智行也亮出了自己的智算中心——雪湖·绿洲(MANA OASIS),该超算中心由毫末智行和火山引擎联合打造,是国内自动驾驶行业最大的智算中心。
▲毫末智行MANA OASIS正式发布
对于超算中心来说,有几个指标非常重要,一是算力,由于超算中心要处理大量的数据、对模型进行训练等,这都需要算力的支撑。
MANA OASIS的每台服务器配置了8个GPU卡,实现浮点运算每秒67亿亿次,目前超算中心第一期已经部署了超过2000个GPU。
▲毫末智行MANA OASIS性能情况
这意味着,毫末智行可以通过MANA OASIS同时部署大量的模型训练,持续实现算法优化。
二是存储能力,自动驾驶车辆在日常运行中将会产生大量的数据,并且这些数据多是分段式的,为了更好的利用这些数据,需要快速对这些数据进行存储,这就要求超算中心具备比较强的存储能力。
MANA OASIS基于高性能并行文件系统VePFS,具备高达2T/s的读取速度,可以支持百亿级小文件的高速读写。
▲毫末智行MANA OASIS系统架构
根据行业专家估计,每辆自动驾驶车辆每天可以产生5~20T的数据量,这意味着毫末智行MANA OASIS可以在数秒内就完成一辆车的数据存储,这将会显著降低成本,实现更高效的存储,同时也可以提升毫末智行的训练速度。
三是通信带宽能力,由于计算多需要多台服务器协同工作,因此对于通讯带宽也有一定的需求。
MANA OASIS的服务器之间采用了4张200G带宽的RDMA网络互联,可以提供高达800G/s的网络带宽,这一设计确保了不同服务器之间的协同能力,从而促进超算中心更好的发挥作用。
此外,超算中心的数据管理能力也非常重要。毫末智行用两年的时间,研发出了一套面向大规模训练的Data Engine,将百P数据的筛选速度提升了10倍,百亿小文件的速记读写延迟小于500微秒。
通过这种方式,毫末智行对于文件的随机读写能力有了非常明显的提升。
▲火山引擎总裁谭待(左)与毫末智行CEO顾维灏(右)
而说到底,毫末智行建立超算中心最核心的任务就是对算法模型进行训练。为了实现这个目的,毫末智行和火山引擎进行了专门的合作研发,建立了高性能的算子库,可以快速适配超过200种网络结构,支持目前业界所有主流的网络模型。
在训练方面层面,毫末智行采用了SpareMoE的方式实现多机共享,同时训练多个任务,这种方式和业界常规的方法相比,训练效率提升了100倍左右。
▲MANA OASIS训练加速
随着MANA OASIS智算中心的落地,毫末智行在处理数据方面的效率将会进一步提升,在自动驾驶3.0时代将会占据更大的优势,有望在下一阶段继续实现领跑。
三、MANA五大模型亮相 实现全栈技术布局
有了超算中心,如何才能够更好的发挥作用呢?
毫末智行给出的答案是MANA五大模型,分别为视觉自监督大模型、3D重建大模型、多模态互监督大模型、动态环境大模型和人驾自监督大模型。
由于目前自动驾驶车辆每日都会产生大量的数据,为了更好的利用这些数据,需要自动驾驶公司对这些数据进行标准,为了提升标准的准确性,此前自动驾驶企业多会选择人工标注。
但人工标注也会存在两个问题,一是速度比较慢,二是成本非常高。因此,数据标注的自动化势在必行。
毫末智行的视频自监督大模型正是出于这个目的,目前自动驾驶车辆所收集到的数据大多是单帧形态,但为了获取更高价值的数据,需要将数据从离散帧转化为clip形态。
▲视频自监督大模型
毫末智行先根据数据clip建立一个大模型,通过一部分人工标注好的clip数据对模型进行调整,这其中仅有10%的关键帧进行了人工标注,另外90%的帧都未标注。然后训练整个模型根据当前帧猜测下一帧的内容,对余下90%的帧进行自动标注,从而实现100%的自动化标注。
根据毫末智行的测试来看,这一大模型的效果非常好,即使面对一些极端困难的场景,自动标准也非常准确。
对于自动驾驶系统来说,进行大量数据收集的目的主要是为了进行corner case的收集,从而不断完善自动驾驶算法。
但corner case属于可遇不可求的场景,因此从真实的场景中收集非常困难。毫末智行的3D重建大模型则是通过仿真的方法进行corner case的生产。毫末智行通过改变视角、光照、纹理材质的方法,直接生产新的corner case。
▲3D重建大模型技术
通过这种方式,毫末智行将可以通过成本非常低的方式来不断扩展自己的corner case库,持续对自动驾驶算法进行持续迭代。
以上两个大模型都是在对车辆收集到的数据进行处理,而车辆在日常的行驶过程中,也需要大模型对障碍物识别、道路识别、决策等进行训练。
在目前的感知的算法中,车辆可以很好的识别已知障碍物,但对于未知障碍物的识别效果并不算好,而这将会影响到车辆运行的安全性。
针对这个问题目前主要有两种方法进行解决,一是扩大白名单,通过大量数据收集进行新物体的标注,另一种方式则是做三维重建,不对障碍物的具体种类进行确认,只确认其是否会对车辆存在影响。
毫末智行采用的则是第二种方法,推出了多模态互监督大模型,引入激光雷达作为视觉监督信号,把道路上的各种结构精准还原出来,告知系统是否可以通过。
▲多模态互监督大模型
这一系统主要针对比较复杂的场景,在未来的城市领航辅助驾驶推广过程中将会发挥非常大的作用。
在感知之外,高精地图也是非常重要的辅助工具,但现阶段自动驾驶玩家都在强调重感知轻地图的做法,进一步降低对高精地图的依赖程度。
毫末智行一直是重感知轻地图方案的拥护者,其动态环境大模型正是为了降低对高精地图的依赖。毫末智行更加重视拓扑信息,实时判断路口的拓扑结构,通过自回归的编码器,让系统可以像人一样根据标准地图的提示,实现对路口的识别。
▲动态环境大模型
目前,毫末智行在北京和保定做了很多测试,对于85%的路口的拓扑推断准确率可以达到95%。
而在决策算法方面,毫末智行则推出了人驾自监督认知大模型,引入用户真实接管数据,用RLHF(从人类反馈中强化学习)思路训练一个奖励模型来挑选更好的驾驶决策。通过这种方式,毫末智行的自动驾驶系统在掉头、环岛等困难场景中通过率提升了30%以上。
▲人驾自监督认知大模型
通过上面的介绍,不难发现,毫末智行五大模型分别关于自动驾驶数据标准、障碍物识别、道路规划、corner case场景收集和驾驶决策等方面。基本上涵盖了自动驾驶的全套流程,深化了毫末智行的全栈自研能力,为辅助驾驶大规模落地奠定了基础。
当然,仅仅对算法进行升级是不够的,毫末智行也对车端感知架构进行了升级。
正因为软硬件的同步升级,毫末智行才有能力实现国内量产第一,并且还有信心要在明年上市国内首个可大规模落地的城市导航辅助驾驶,到2024年上半年,将实现HPilot落地中国100个城市的计划,头部城市落地全场景NOH,实现点点互达。
2024年下半年到2025年,毫末智行将会推动更大规模全场景的NOH快速落地,全面迈入无人驾驶时代。
四、继续发力无人配送 朋友圈持续扩大
除了在量产车领域不断发力,毫末智行也一直在无人配送行业发力。
毫末智行的末端物流自动配送车已经初步形成了商业闭环,目前交付量已经超过了1000台,在去年11月份,毫末智行还和达达达成了深度合作,将一起探索无人配送的常态化应用。
截止2022年底,毫末智行的无人配送车小魔驼订单量已经突破了13万单,并且还在持续增加。
而在其他方面,毫末智行正在扩大自己的朋友圈。
▲毫末智行合作伙伴出席HAOMO AI DAY
在本次活动上,多个行业权威机构、AI公司、汽车行业公司都参与了此次大会,毫末智行还在会上和北京交通大学计算机与信息技术学院达成合作,双方就自动标注相关技术领域展开深入合作。
最重要的是,毫末智行第七届HAOMO AI DAY和特斯拉此前举办的AI DAY还有着同一个目的,那就是招聘,目前毫末智行在北京、保定、上海、深圳、德国慕尼黑等地都建立了研发中心,均在进行大量AI人才的招聘。
结语:毫末智行走在自动驾驶企业前列
截止目前,毫末智行已经在业内拿到了多个第一名,如中国自动驾驶公司首个智算中心、中国首个自研AEB算法落地海内外的公司、中国量产自动驾驶第一名,中国首个自动驾驶数据智能体系MANA等,已经拿下了十项第一。
此外,毫末智行还获得了MIT麻省理工科技“全球50家最聪明公司”称号、2022中国独角兽榜单、2022年度人工智能领航企业、2022新经济之王、年度智能驾驶品牌金球奖、北斗卫星导航应用推进贡献奖、中国交通运输协会中国智能物流配送推荐无人车、2022年度卓越雇主等多个行业殊荣。
现阶段,毫末智行正走在行业自动驾驶的前列,推动全无人自动驾驶的快速落地。
目前,全球多个国家都陆续出台了利好自动驾驶的政策,随着AI技术、芯片、传感器等技术的发展,中美已经率先进入到了自动驾驶3.0时代,而毫末智行也已经率先跑进了自动驾驶3.0时代。