车东西(公众号:chedongxi
作者 | 小崔
编辑 | Juice
日前,海天瑞声在中关村论坛上宣布开源多模态数据集,并发布企业品牌焕新战略,公司英文名称将从“SpeechOcean”改为“DataOcean AI”,中文名称不变,并将启用全新Logo。
据了解,海天瑞声即将开源的多模态数据集涵盖图像、语音、文本等多个维度,海天瑞声也希望通过此次数据集开源与全球AI开发者和研究人员建立更加紧密的合作关系。
会后,海天瑞声CEO王晓东、CTO黄宇凯接受车东西等媒体记者采访,就企业品牌焕新战略和自动驾驶平台DOTS-AD进行了深入交流。
一、布局自动驾驶领域 数据标注效率提升8倍
近年来,海天瑞声基于海量数据库构建了一套数据驱动系统,在自动驾驶领域加速布局。
今年4月18日,海天瑞声正式推出“DOTS-AD自动驾驶平台”。该平台是一款专为自动驾驶场景设计的全栈式数据平台,能够支持多维度、全方位的自动驾驶标注任务,比以往的数据标注效率提升了8倍,另外,该平台还可以支持上万人同时作业,能够解决项目经理和标注员的使用痛点。
▲海天瑞声CTO黄宇凯
据了解,DOTS-AD自动驾驶平台有四个核心功能:一是支持自动驾驶领域各维度2D/3D/4D点云或图像数据标注;二是能针对不同场景支持辅助标注/自动化标注;三是支持项目的柔性管理,支持流程/工具/标签的自定义;四是可实现对数据的智能化管理,确保敏感数据安全合规。
黄宇凯表示,海天瑞声在智能驾驶数据训练领域建立起核心壁垒,也将赋能自动驾驶技术迈向新高度。
二、发布品牌焕新战略 图文音频AI数据全覆盖
会上,王晓东发布了海天瑞声企业品牌焕新战略:公司将启用全新Logo,英文名称将从“SpeechOcean”改成“DataOcean AI”,中文名“海天瑞声”不变。
▲海天瑞声CEO王晓东
王晓东表示,海天瑞声将在数据科技和人工智能领域进一步发展和探索。
此前,海天瑞声因海量智能语音数据被大家所熟知,但近些年来随着人工智能技术的不断迭代与发展,海天瑞声的业务已从单纯的语音领域服务,扩展至提供覆盖语音、计算机视觉、自然语言处理和多模态的数据解决方案及成品数据集,未来还将支持以数据驱动的生成式AI业务发展。
据了解,自2005年成立以来,海天瑞声就一直在为AI产业链上的各类机构提供AI算法模型开发训练所需的专业数据集。目前这些数据集已覆盖智能语音、计算机视觉、自然语言等AI核心领域,海天瑞声的产品和服务也已获得阿里巴巴、腾讯、三星等国内外头部玩家的认可,并在自动驾驶、虚拟主播、声纹识别、人脸姿态等众多人工智能场景及相关算法模型的训练过程中获得应用。
三、数据安全合规 深耕更有优势
会后,海天瑞声CEO王晓东、CTO黄宇凯接受了车东西等媒体记者采访。
由于不同地区对数据安全的合规性要求有差异,有记者认为国内外企业的数据有交叉,存在数据安全问题。
对此,王晓东表示,虽然国内外企业的数据有交叉,但海天瑞声在做数据工作时的第一要义便是按照当地的数据安全法规展开。以中国为例,中国不仅有数据安全法,而且还有数据出口法,而海天瑞声工作展开的前提和底线便是合法合规。另外,公司内部全体员工每个月都会进行数据安全培训并考核,所有工作严格按照法律标准进行。
针对部分大厂入局自动驾驶行业,有记者问到海天瑞声的行业竞争优势。黄宇凯表示,海天瑞声成立已有18年,在数据收集和标注方面积累的经验更丰富,一些大厂虽然在规模和资金等方面有优势,但其业务范围广,主营业务也并不在此,也就导致了这些大厂在数据标注方面扎根不深,而数据是海天瑞声的立身之本,所以海天瑞声最大的优势便是足够专精,在自动驾驶数据标注方面也就更专业。
结语:海天瑞声以数据驱动加速人工智能破局
数据作为人工智能发展的重要一环,大模型的出现也给数据需求带来了新的挑战和机遇。
而海天瑞声在数据方面深耕多年,无论是开源多模态数据集,还是入局自动驾驶数据标注和AI+等行业,海天瑞声正在以数据驱动推动人工智能相关行业的发展。