车东西(公众号:chedongxi)
文 | Origin
4月16日,第十八届上海车展正式开幕。当数以万计的观众涌入会馆,一睹千余辆展车的风采之时,一家AI公司,也加快了“上车”的步伐。
4月17日,语音交互AI公司思必驰,与国内大型第三方车联网公司博泰签署战略合作协议,建立语音AI私有云平台,为更多车企赋能。
▲思必驰与博泰签署战略合作协议
这次合作的背景,是此次上海车展上,超过8成的新车型,都搭载了智能语音交互技术。车载语音交互技术的市场潜力显露无疑。
这家在人工智能创业领域颇有名气,要如何在愈发兴盛的车载智能语音交互市场开拓更大的发展前景,思必驰能为这个领域带来什么差异化的价值?
车东西与思必驰副总裁雷雄国进行了一番深度交流,他向车东西绘出了思必驰智能语音交互技术的上车路线。
▲思必驰副总裁雷雄国
一、从后装到前装 思必驰语音交互上车的技术底气
提及思必驰,对智能家居或AI有兴趣的人应该不会陌生,这家以AI语音交互技术为出发点的公司,在语音交互技术席卷各类消费电子产品的浪潮中贡献了重要力量。智能音箱、智能电视、对话机器人····它们背后都有思必驰的身影。为人熟知的小爱同学、天猫精灵、华为音箱,关键的语音交互技术提供者,正是思必驰。
想象力更大的车载语音市场,其实思必驰也早已开始布局。思必驰语音交互上车之路,是从后装渠道开始的。在早两年的后装智能车机、智能后视镜热中,思必驰向大量的硬件设备商输出了语音交互的技术方案,合作伙伴包括车萝卜、360、飞歌、小米70迈、盯盯拍、兜风出行、易图等等。其中,思必驰投资的车萝卜,目前在国内HUD领域排名第一,2019年主推AR-HUD。
在大量硬件设备合作伙伴的产品输出下,雷雄国告诉车东西,思必驰在后装车载语音交互市场的占有率达到70%。
而近两年,智能语音交互技术的进一步成熟,突破了以往车载语音技术命令式交互的局限。语音交互的体验得以大大改善,它成为新车型产品力的重要组成部分。这使得车载语音交互技术从后装走向前装,成为不可阻挡的大趋势。
车企有需求,思必驰有技术,从后装走向前装理所应当。但趋势归趋势,这条路并没有那么容易走。雷雄国向车东西表示,后装市场主要是思必驰向合作伙伴输出技术方案,而在前装市场,车厂会提出更多的技术指标,就车载的场景来说,有三大关键问题必须解决:
1、车内声场环境复杂,包括风噪、胎噪、背景回声在内的各种噪声加大语音的采集识别难度。
2、车内网络环境复杂,汽车高速行驶过程中网络连接质量通常较差,语音交互技术过多依赖云端的话体验会很差。
3、车内人车交互的主体从驾驶员拓展到了前排乃至后排乘客,传统只针对驾驶员的语音交互方案无法满足车内其他人的需求,或者会在驾驶员语音交互过程中受到其他乘客干扰。
针对这三个问题,思必驰提出了自己的解决方案。
对车内声场环境复杂的问题,雷雄国告诉车东西,思必驰通过后装设备采集到的数据发挥了很大作用。思必驰在后端建立了一套大型的自动化数据处理模型,以及训练、测试的流程,让思必驰的语音交互算法在各种实际的噪声环境中不断训练、强化,保证语音识别的准确性。
对车内网络经常处于弱网状态的问题,思必驰则有意识地降低了对云端设施的依赖。具体包括:通讯录、控制系统操作、导航、音乐等常用功能的语音控制,思必驰将其做在了本地(车辆端),不必依赖网络;本地的数据,与云端数据更新保持快速同步,并且会根据用户的画像做个性化的数据更新;此外在语音指令的置信度和网络延时的判定方面,思必驰也进行了大量优化工作。这些工作的结果是,在没有网络的情况下,思必驰提供的技术方案也能支持关键任务的操作。
对于车内多主体的交互难题,思必驰则推出多音区方案,进行声源定位,在不同音区内精准识别不同对象的语音。目前,思必驰能够提供双音区、四音区、六音区的交互方案,其中既包括更多靠软件算法实现的单麦克风方案,也有使用多麦克风搭配软件的软硬一体化解决方案。
▲思必驰多音区方案样例
在这些解决方案之外,思必驰还做了大量的工作,比如对语音进行“清洗”的信号处理算法优化、语义理解算法的优化、唤醒+识别同步技术的开发、大型知识库的建设等等。
这些全面优化语音交互体验的技术工作到位,才有车企选择买单。雷雄国称,虽然前装的技术标准指标更高,开发周期更长,但好在确定性更高——换句话说,收入更有保障。
车东西了解到,思必驰目前已经与20余家车企建立了合作,客户包括吉利、长城、一汽大众、北汽、小鹏汽车等等。
车东西还了解到,思必驰能够拿到众多车企的订单,除了技术作保障,思必驰的态度也很重要。
二、“让车企有选择” 开放模式打动车企
车企在与供应商合作的过程中,往往会考虑“选择权”,供应商过于强势是主机厂的大忌。而作为智能语音技术供应商,思必驰的开放态度,则让合作伙伴们很放心。
思必驰的开放首先体现在内容生态上。
思必驰引入了来自广泛互联网、移动互联网的第三方内容服务,包括BATJM等。雷雄国称,目前思必驰已经接入200余家企业的内容与服务。
在广泛对接全网资源的情况下,思必驰基于其DUI开放平台,开发了100余个高可用的车载语音交互技能,让车内的语音交互有了更高的便利性与可玩性。
而在与车企的合作过程中,思必驰也秉持着这种开放性。
雷雄国向车东西表示,思必驰将自身的车载语音交互技术方案打包成了“天琴语音助手”,这是一个全链路的语音交互产品,集成思必驰150余项高可用的车载语音技能,支持声纹识别、多音区、离线交互、方言识别、车载客服、快捷命令、OTA升级等能力,为车企提供智能语音交互的全套支持。
▲思必驰全新车载语音交互系统:天琴助手
不过,如果车企不想全要也没关系,思必驰也能通过SDK的形式,为车企以及Tier-1提供单点语音技术支持。
思必驰这种让车企“有得选”的开放性,甚至渗透到了非常细节的技术中。上文提到的思必驰多音区解决方案,雷雄国告诉车东西,就近场而言,一枚麦克风+软件算法的“纯软方案”,和多枚麦克风+软件算法的“软+硬方案”,在单纯的识别效果上差距并不是十分显著。纯软的方案可能成本更低,但是无法满足车厂的高级需求,例如说话人的位置确认、身份识别、更针对性的车内消噪处理等。同时还要考虑和设备的主控芯片的配合,以追求最高的性价比、达到最好的效果。
思必驰提供两种不同方案,主要目的在于满足车企不同的开发需求。
当思必驰对车企的需求已经考虑到如此细致的程度的时候,车企当然会欢迎这样用心的语音交互供应商。
三、与博泰合作加速“上车” 车规级AI芯片正研发
理解了思必驰的开放性,对思必驰与博泰的合作也就不难理解了。
博泰作为国内最大的车联网公司之一,其态度也是高度开放,并且在BAT强势入局车联网之时紧紧站在了车厂一边。这使得博泰对车厂的需求、车联网的产品理解很深,也积累了众多车企合作伙伴
在思必驰与博泰的战略合作发布会上,博泰CEO应宜伦透露,为了搭建这一语音AI私有云平台,去年下半年双方开始接触,组建了百人团队。
雷雄国告诉车东西,思必驰与博泰的合作根据各自所长进行了分工,思必驰更多提供核心的语音AI技术,博泰则围绕车联网产品进行打磨,调用第三方服务。双方共同搭建一个平台,去为车企服务。
而思必驰与博泰共同搭建的语音AI私有云平台,对思必驰语音技术上车有着新的意义——以往车企在车联网的合作中总是顾虑数据与差异化的功能点被第三方的公司取得。这一语音AI私有云平台建立后,车企既可以通过它调用各种语音交互能力,又能通过数据的隔离保证数据的安全与功能的差异化。
可以说,思必驰的开放态度给了车企更多选择,与博泰合作建立这一私有云平台,则解决了车企接入车联网生态的一大痛点。可以预见的是,思必驰在前装领域的上车步伐,将在这一私有云平台的帮助下进一步加速。
当然,思必驰对车载语音交互前装市场的思考,也不止于此。
雷雄国还向车东西透露,思必驰已经在今年年初发布的AI语音芯片“TH1520”基础上,规划了车规级AI芯片。这款芯片,车载语音交互体验尤其是本地化功能的体验将会得到提升。
此外,在车内语音、视觉、手势等多模态交互越来越主流的形势下,思必驰也将其目光从语音识别、自然语言理解等领域向多模态交互方向拓展。
思必驰方面告诉车东西,他们依托于上海交通大学-苏州人工智能研究院,正在开展多模态的人工智能交互研究。
结语:不断进化的语音AI公司
在人工智能技术被广泛认知的今天,其不断学习、快速进化的特点成为它被广泛应用的关键优点。
而从事语音人工智能技术开发的思必驰,也拥有这样的特点,这家公司在短短数年内,将其智能语音交互技术从智能终端走向多维企业服务,汽车领域又成功地从后装走向前装。
思必驰不仅在单点技术积累上不断进步,对市场的理解也在迅速加深,如今其技术维度或即将迎来拓展。
就像AI在不断进化的过程中应用的场景不断拓展,思必驰在不断进化的过程中,也赢得了越来越多的机会。