车东西(公众号:chedongxi)
文 | Origin
随着越来越多的语音助手出现在我们的生活中,我们会愈发明显地感受到,人们与智能终端的交互方式,正在从单纯地触控,慢慢转入结合语音。
不过,尽管我们更熟悉的可能是谷歌助手、苹果Siri等智能语音助手,但其实在汽车上,语音交互的应用要早得多。
如今,车内的语音交互也在走向智能化,BAT纷纷携各家智能语音助手入侵车机。巨头的阴影下,创业公司要怎么突围?傲硕科技有自己的答案。
一、车载语音老司机创业
傲硕科技是一家成立于2012年的车载语音技术服务公司,其创始团队主要来自国际知名车载语音方案商Nuance。CEO郑天堂是Nuance中国分公司的第一批员工,从09年开始时就接触车载语音,傲硕的CTO同样也是Nuance出身。
(傲硕科技CEO郑天堂)
2013年,傲硕参与上汽通用的车载语音前装项目竞标,并成功拿下。2015年,其为上汽通用提供的可使用自然语言的车载语音方案量产,当年的别克新英朗搭载的即是傲硕的语音方案。
成立头几年的傲硕便这样成为了上汽通用的“专属服务商”,别克GL6的车载语音方案,也由他们提供。傲硕特别向车东西强调了一点,他们当时能提供的能力,已经和传统的车载语音完全不同了。后者虽然是语言交互,但交互逻辑仍然是传统的“菜单栏”形式,一个关键词对应一个选择。相比之下,傲硕提供的是自然语言交互,用户在别克新英朗上说我想听某首歌或者直接说我想去哪儿,就能直接获取服务。因此在车载自然语言交互上,傲硕是起步较早的那一批。
(别克GL6车载系统)
到如今,傲硕的团队成员更加多元化,分别来自上海贝尔,四维图新,泰为等公司。
在”上汽通用供应商“这样的招牌下,傲硕也开拓了更多的客户,包括数家主流的国际Tier-1以及国内整车厂。
二、本地+云端 打造车载纯语音交互
在15年的别克新英朗上,傲硕提供的是纯本地化的解决方案。解释一下,就是语音识别只通过车载的计算硬件完成。由于车载芯片通常落后消费电子产品一到两代,并且还有车内的噪音干扰,因此纯本地的技术难度不小。但傲硕提供的方案仍然满足了上汽通用给出的指标。
而到了近年,人工智能的兴起让语音识别的准确率上升到了新高度,并且语音的交互与车内场景天然适配,因此打造车载语音交互系统成为了一大潮流。
但纯本地的车载语音方案在语义理解、功能丰富性上存在缺失,显然不符合习惯了互联网体验的用户们的要求。同时,傲硕也观察到2018年,将有大批的车辆真正连上网。
审时度势,傲硕推出了“本地+云端”的Hybrid混合车载语音方案,核心产品包括本地识别引擎、云端识别引擎、自然语言理解引擎、语音合成TTS引擎以及声纹识别引擎。
在这套产品中,云端计算力、数据库的加入可以提高识别的准确率,并确保真正懂得了用户的需求予以满足。本地识别引擎则是基础,在离线状态下,它也能保证用户基本的使用需求。
语音合成引擎则是车内柔和女声的直接来源;声纹识别则帮助区分不同使用者,便于功能个性化。
傲硕的这一套方案支持WinCE、Android、Linux、QNX等操作系统,并且是在软件层面作了大量优化,对车载硬件的性能要求不高。
应用了傲硕的方案后,行车环境下的大部分场景,用户都可以通过语音交互来获得满足(目前已支持40余个场景)。同时,傲硕还在不断对各个引擎进行迭代优化、接入第三方服务,将更多的场景纳入其覆盖范围中。
三、巨头杀入 傲硕凭什么站住?
毫无疑问,车载语音是个大市场——今年以来,BAT纷纷推出了自家的车载系统:百度的小度车载系统、腾讯的AI IN CAR、阿里的斑马智行,并且他们都让语音交互唱主角。
但BAT的加入也让车载语音似乎变成了一个死亡赛道:语音识别、理解方案连同识别之后需要的各种服务、内容,BAT都一并给了。也是这样的完整方案,让车厂纷纷开始站队——北(汽)上(汽)广(汽)搭上BAT。
只提供语音识别方案的傲硕要如何迎战BAT?并且,就算不提BAT,傲硕也有一大批语音方案商竞争对手,比如科大讯飞、云知声、思必驰等等。
对此,郑天堂分析了一番局势。他认为,BAT引发车厂站队是必然的,三巨头的大平台有着各种资源,车厂不可能视而不见。但同时,做平台的问题在于,它提供的东西是标准化而非定制的。很多车厂特别是大型车厂,往往有定制化的需求,这是BAT的车载系统难以满足的。
傲硕的优势便是定制化开发。为了满足不同车厂的需求,傲硕的公司架构结合了项目驱动+产品驱动,一部分研发人员保证底层技术推进, 另一部分人员则集中解决车厂的针对性需求。
而相较于互联网出身的技术方案商,傲硕的优势是和车厂接触更早,拿到了更多车内场景的数据。在同车厂的合作过程中,傲硕知道车厂的最核心诉求是什么——在保障安全的前提下,尽可能提升体验。
而与上汽合作的前装开发经验,使得傲硕清楚地知道面向车厂开发语音系统,可能会踩到的坑在哪里。比如设计一个打电话的功能,就需要考虑到用户会以什么形式说出打电话以及打给谁、会不会出现重名、是否会引发功能误操作等等情况,而在这之前,还需要对语音进行降噪处理。
郑天堂表达了他的观点:互联网势力虽然如今大肆涌入汽车行业,但由于汽车的核心是安全,所以互联网公司最终仍要主动适配车厂而不是全然颠覆车厂。而孵化在汽车产业中的傲硕,在配合车厂这个方面做得不错。
结语:车载语音服务商的汽车派
从交流中可以看出,虽然做的是互联网公司热爱的语音交互,但傲硕还是隶属于汽车产业的一家公司。在互联网行业势力与汽车行业势力的动态博弈中,傲硕还是站在汽车这边的。
不过郑天堂称,他们也在产品思维上、接入第三方服务上,向互联网公司学习,保持自身产品的迭代,培养用户思维。
郑天堂称,未来两年,就会有多个品牌的汽车搭载傲硕的语音交互技术上市。