长城语音系统将迎大升级!响应达到毫秒级,多意图精准识别

车东西(公众号:chedongxi)
作者 | 晓芳
编辑 | Juice

车东西4月12日消息,长城汽车通过一场公开课的形式展现了咖啡智能新一代座舱系统——Coffee OS 2的语音交互体验以及与行内专家展望了未来智能座舱的发展方向。

在公开课现场,长城汽车演示了Coffee OS 2在语音交互方面的诸多功能,对于用户比较关心的可见即可说、全局免唤醒等语音交互能力,Coffee OS 2都表现不错,媲美小鹏Xmart OS。

在智能化、数字化、信息化技术蓬勃发展以及终端市场消费需求升级的双重驱动下,汽车不断被重新定义,已经不仅仅是传统意义上的出行工具,而是向智能的第三生活空间快速进化。

而出行工具向第三生活空间的转变就绕不开智能座舱,对于智能座舱,其语音交互能力又是重中之重。

一、250毫秒的唤醒速度 多意图指令精准执行

为了展现Coffee OS 2在语音交互方面的能力,长城将Coffee OS 2与小鹏汽车Xmart OS进行了6个维度的对比,包括响应速度、多领域多意图指令精准识别执行、后排抑制、可见即可说、全局免唤醒以及模糊指代。

总的来说,Coffee OS 2在以上6个维度的语音交互能力表现都很不错。

尤其是在多领域多意图指令精准识别执行方面,Coffee OS 2较Xmart OS表现更好,在驾驶员说出打开车窗、打开蓝牙、驾驶模式运动、打开空调等十项指令后,Coffee OS 2都能无误地执行。

长城语音系统将迎大升级!响应达到毫秒级,多意图精准识别▲多领域十意图指令测试

对于如何精准执行多意图指令,长城汽车智能语音产品负责人王少欣表示,长城将大规模预训练模型和递归子句解析算法相结合,用少量的样本训练复杂模型,在车控技能里面进行递归执行实现多指令并行。

长城语音系统将迎大升级!响应达到毫秒级,多意图精准识别▲长城汽车智能语音产品负责人王少欣

除多领域多意图指令精准识别执行方面,长城汽车Coffee OS 2与小鹏汽车Xmart OS在其他方面的表现旗鼓相当。

在响应速度方面,Coffee OS 2的唤醒速度为250毫秒,响应速度也达毫秒级。

而当后排人员在闲聊或者发出类似于“打开车窗”等指令时,前排的语音控制也不会受到影响,这对行车过程中更好地听从驾驶员的指令,以保证驾驶效率、安全性起着重要作用。

王少欣表示,Coffee OS 2实现了全场景的三重拒识,即拒识背景噪声、车内用户闲聊以及非人机交互杂乱对话。

对于用户比较关心的可见即可说功能,Coffee OS 2既可实现车上本身设置的可见即可说,又可实现第三方应用的覆盖,即Coffee OS 2可语音控制当前页面所有的内容。

此外,Coffee OS 2还拥有免唤醒、多轮对话、车机闲聊、跨域知识上下文等语音交互能力,同时支持触控交互、手势交互、头姿交互等各种自然交互模式。

二、Coffee OS 2向下可兼容 向上可适配各大车型

长城汽车Coffee OS 2以自研框架层作为“1个自研中间件”,立足App和HAL这2个自研统一接口,可实现“N种硬件配置+应用服务生态“,“1+2=N”的底层架构让其向下兼容多种高算力平台,向上可适配长城汽车旗下各大品牌车型。

长城语音系统将迎大升级!响应达到毫秒级,多意图精准识别▲咖啡智能新一代座舱系统——Coffee OS 2

同时,Coffee OS 2可以根据用户的不同视听感受需求,配备不同的显示屏、AI算力、16G大内存、UFS 2.1储存协议、可集成适配不同AI算法的千兆级以太网接口等硬件,以及座舱OS、自研语音、自研地图/导航、自研视觉算法等自研软件。

结语:技术做加法 用户打扰做减法

“咖啡智能座舱系统更加注重用户体验,在技术层面做加法,对用户打扰做减法”

在此次公开课上,清华大学汽车系博士张抗抗这么回答智能座舱功能是否越多越好这一问题,可见,长城汽车在不断追求智能座舱的更加智能化、人性化。