车东西(公众号:chedongxi)
作者 | 明成
编辑 | Juice
车东西9月8日消息,昨天,AI数据服务公司恺望数据宣布其完成Pre-A轮数千万级别融资,本次融资由亚盛投资领投,清智资本也参与了投资。
▲恺望数据活动现场
恺望数据还发布了最新的”自动化AI数据产线”,包括支持4D-BEV感知算法的数据拼接及数据标注工具链、 “5KW大点云”产品、3D辅助标注等数据服务技术及工具链。
同时,恺望数据公布其为AI大模型研发的数据标注工具链和强化训练工具已投入使用。
一、获千万级投资 支持4D-BEV算法的数据工具链发布
昨天,恺望数据在“恺望和他的朋友们2023年度故事会”活动上宣布其完成数千万元Pre-A轮融资,本次融资由亚盛投资领投,清智资本参与投资。这是恺望数据在一年内完成的第三次融资,此前天使轮及天使+轮投资方包括辰韬资本、璞跃中国、三一集团和溪山天使汇等。
恺望数据还在活动上宣布,公司已研发出可支持4D-BEV感知算法的数据拼接及数据标注工具链,该工具可支持大数据流并行作业、可同时支持200万人同时标注,目前已在车企应用。
落地城市NOA是今年自动驾驶领域的热点,而BEV感知算法是国内大部分自动驾驶和车企选择的技术路线。
恺望数据方面透露,为了迎合纯Lidar 4D-BEV、Lidar+Camera 4D-BEV、纯Camera 4D-BEV、Occupancy、End-to-end 、Full Self- LearningEnd-to-end的发展,恺望数据对产线平台进行了升级,从业务响应速度、数据文件大小支撑、数据并发、数据处理灵活度等方面进行了全方面升级,将提升数据质量。
在效率方面,恺望数据的高并发服务器可以做到不断扩展以应对不断增长的数据任务量,通过动态缩扩容技术,有效地处理更多的并发请求,从而提高系统的可伸缩性。”为了减少高并发作业下的服务器压力,我们通过算法降纬、自研的Web Work 调度系统、Web GPU、前端分布式计算等方式和技术,将更多计算和处理放到前端处理。”恺望数据创始人、CEO于旭表示。
▲恺望数据创始人、CEO于旭
恺望数据方面表示,以往自动驾驶行业可能只看数据价格,现在既看价格,还要求稳定、要求高质量、要求高效率。因此,恺望数据将通过研发最技术和优化运营效率,持续打造提供高安全、高质量、高效率的稳定大规模数据的核心能力。
二、“5千万大点云”工具平台 8G内存电脑可运行
恺望数据负责人介绍,恺望的点云数据标注能力的工具达到了千万级别。通过自研Web多线程调度系统,完成点云异步加载和渲染,“5KW大点云”工具平台经验证即使在8G内存电脑上也可运行,上限可支持1亿点云加载。
恺望数据方面表示,Web多线程技术可以执行复杂的计算、处理大量数据、进行后台网络请求在后台线程中运行,不会影响用户界面的响应性,将数据加载、点云处理、渲染分开异步完成处理的同时不会影响业务正常使用。
▲现场展示
此外,恺望数据负责人还在活动现场介绍了“3D辅助标注”工具,该工具可以在2D中标记后反投影到3D中精准找到标注物的工具,故事会现场上展示了这一工具的使用方法和特点。
三、”标注人力,正从卷价格到卷质量”
恺望数据方面表示,要解决自动驾驶数据的长尾问题,目前阶段仍无法全自动化,目前行业数据仍需要经历“人的智慧”。
恺望数据数据创始人、CEO于旭提出:”什么样的人能训出什么样的模型,对于新的领域,首先需要有主观判断的人。AI大模型的数据来自各类垂直专业领域,要在短时间内形成大量稳定优质的标注供应能力,经过一段时间的探索,我们发现大量使用本科及以上学历各专业的毕业生能够快速满足大模型标注人才的需求,但在行业内极为稀缺。”
恺望数据在去年打造了“恺望数据学院”,通过高校合作储备及培训了大批高校学生标注员,将同时通过共建产融实训基地的形式,为行业提供大量稳定且优质的数据标注服务。
恺望数据方面介绍,目前恺望数据学院已培训 50所学校,培养超过1500 名学生为恺望提供数据标注服务,计划至今年年底将超过2000人规模。
此外,恺望数据方面还提到,比自动驾驶更需要“高端标注人员”的,是AAI大模型行业。据透露,随着人工智能与大模型的快速发展,AI大模型相关的数据服务今年以来也呈现爆发式增长。恺望数据目前已为多家知名大模型公司提供数据服务,其自研的AI大模型数据标注工具链和强化训练工具也已正式使用。
结语:人工标注或将提升数据质量
随着自动驾驶产业不断发展,各大自动驾驶公司和车企对数据处理的需求逐渐增加,仅成立两年的恺望拿出了自己的解决方案。其重人工的数据标注的路径选择可能会带来更加精确、稳定的数据标注服务。但人工也带来了成本和稳定性的问题,仍需进一步观望。