通过全新的多模态交互解决方案,引入多感官、对话式的体验可以极大的提升乘客与车辆之间的信任关系,而这也是L3级别及以上自动驾驶汽车及未来车载体验的核心所在。
在2020 CES展上,Cerence与e.GO MOOVE GmbH、e.GO Digital GmbH以及Saint-Gobain Sekurit联手为e.GO Mover 自动驾驶电动巴士打造了具有革命性、多模态交互体验。该交互模式聚焦于未来自动驾驶、电动和共享汽车,通过语音识别、自然语言理解和输出,结合语音信号增强及Saint-Gobain Sekurit透明屏幕技术,让乘客与自动驾驶汽车之间进行自然交互。Cerence首席执行官Sanjay Dhawan表示:“Cerence自豪地站在驱动着汽车行业不断创新的新四化--互联、自动驾驶、共享出行及电气化--的交汇点上。虽然业内许多人士预计自动驾驶汽车的交互将由智能手机引领,但我们相信在CES上展示的,前所未有的多模态、多语言交互体验将在建立用户信任及信心方面远超智能手机,并加快消费者对于自动驾驶汽车的接受和使用。”在现场,Cerence实际演示了乘客从机场到交通枢纽的模拟乘车全过程中的人车交互:包括巴士在到站前及到站时,乘客登车时,乘车过程中,巴士正在离站以及巴士离站之后。Cerence大中华区高级产品总监刘峰表示,“e.GO Mover 自动驾驶电动巴士包括多语言自动语音识别(ASR)和自然语言理解(NLU)、语音合成(TTS)和自然语言响应、语音信号增强(SSE)、透明屏幕技术实现将信息投影在车内和车外四项核心技术。”由于这辆车能够自动识别用户正在使用的语言,这对于多乘客、多语言的应用场景至关重要,这也是优于人类驾驶员之处,因为他们对多种语言的理解可能有限。现场工作人员演示了这辆车如何识别用户正在使用英语还是德语,神奇的是该车可以用相同的语言作出回应。语音合成和自然语言响应使这辆车能够与乘客和车外的人们进行流畅的、类人化的沟通。例如,乘客的重要通知可以用更加紧急的语气表述,而延误信息可以用包含歉意的声音传达。
在共享汽车方面,Cerence依靠语音信号增强技术并区分不同的发声区域,可以只识别一个说话人的声音。透明屏幕技术可实现信息投影在车内和车外,该应用包括:位于“驾驶者”座位后面的服务员或乘客助理头像、在整辆车的关键位置显示有关行程的总体信息、每个座位附近均可进行个性化的人车交互、向候车者显示路线等信息的外部投影。驾驶者使用手势来移动、选择在挡风玻璃上显示的部件,进行分段式路线导航、音乐播放、查询天气等操作。例如,驾驶者使用抓取-投掷手势并结合凝视的方式,将导航窗口部件移动至乘客面前的挡风玻璃处,这样乘客就可以扮演“副驾驶”的角色,驾驶者也可以使用点击手势暂停和继续播放音乐,或者播放下一首曲目。值得一提的是,车外景色因乘客仍然可以看穿透玻璃上投影图像而不受影响。e.GO MOOVE首席执行官Günther Schuh教授称,“未来的自动驾驶出行将为消费者在越来越智能化的城市中出行带来新的挑战。在没有驾驶者的自动驾驶场景中,对于需要向车外的人们传递信息的电动车,尤其像在城市中安静行驶的e.GO Mover而言,让用户以自然的方式与车进行交互并获取信息至关重要。”在丰富的交互生态之上,Cerence在Cerence Drive新增了应急车辆检测的功能。当应急车辆临近时,集成了Cerence EVD功能的车载助理将主动提醒驾驶者,以便他们作出相应的驾驶调整。Cerence联合创始人、执行副总裁兼Cerence 核心车载业务总经理Stefan Ortmanns博士表示:“每位驾驶者都经历过听到或看到应急车辆驶近时慌乱的情况,尤其在音乐音量过大或分心时,更是倍感措手不及。我们开发的Cerence EVD正是要解决这一问题,帮助确保驾驶者的行车安全和收到及时的通知。随着自动驾驶功能不断提升,这已经成为了车载体验的关键。”Cerence官方表示,最近他们对1500多名美国消费者进行了调研,以了解他们如何使用车载功能在周边搜索。当被问及未来车载技术如何能够最大程度的改善他们的驾驶体验时,近一半(44%)的受访者表示,他们希望能够在压力较大的驾驶情况下获得更多的帮助。此外,Cerence DRIVE实验室最近的一项研究,调查了驾驶者对警笛声检测的使用预期和观点。研究发现,驾驶者对这一创新功能表示欢迎,67%的受访者期望一旦检测到警笛声,系统能够立即发出通知,并将车内所有其它音频的音量调低。受访者表示,当他们在交通繁忙的情况下以及在郊区/城市的环境中,因受到车内或车外嘈杂声音的影响,警笛声检测将是最有价值的功能。他们同时还希望知道警笛声的相对位置,包括应急车辆行驶的方向,以及距离等信息。Cerence推出Cerence EVD不需要安装任何硬件,只使用车内现有的麦克风即可。它利用紧急警笛信号固有的独特声学结构,能够准确识别警笛声的来源及方向,并可以根据警笛声的类型识别出不同国家及不同种类的应急车辆(消防车、救护车、警车等)。一旦警笛声被检测到,车内电台或其它媒体音量将被调低,并通过车载信息娱乐视听系统对驾驶者发出通知。值得一提的是,因为声学回声消除技术能够有效的消除麦克风信号中的音乐回放,就算驾驶者收听的歌曲包含应急车辆的警笛声或其它声音,Cerence也能够可靠的检测警笛声并及时发出通知。随着汽车的复杂性日益增加,对驾驶者而言,要掌握车内诸多功能、通知、警示灯和按钮等也变得愈加困难。Cerence推出人工智能SaaS产品套件Car Life,全新功能包括可以使用语音访问智能汽车手册。这款人工智能产品套件有助驾驶者能够更便捷的与其车辆进行互动和操作汽车。据介绍,用户自购买汽车开始,便可以获得支持全新SaaS 应用的升级用户体验,驾驶者只需要使用语音以及车载信息娱乐触摸屏便可以了解汽车信息和访问人工智能汽车手册,以及通过集成经销商管理系统预约汽车保养等服务。SaaS 应用模式支持针对每辆汽车、具体的汽车配置及逐渐了解驾驶者的偏好后进行定制 ,并通过配套应用程序,汽车助理语音以及车载信息娱乐系统图像化显示提供信息。Cerence Car Life将包含在Cerence Drive解决方案中,并可与谷歌、亚马逊、百度、阿里巴巴、Yandex等其他全球语音助理集成运行。Cerence 联合创始人、执行副总裁及Cerence核心车载业务总经理Stefan Ortmanns 博士表示:“从首次进入这辆车开始,一直贯穿整个汽车生命周期。我们全新的Car Life产品套件将帮助人车之间建立更加紧密的联系,如同智能手机等电子产品一样,和日常生活紧密相连,难以分割。这将有助提升出行体验,通过提供的信息和知识更好地支持驾驶者,建立品牌忠诚度,最终使汽车制造商受益。”目前,这款创新的智能SaaS产品套件将为驾驶者提供以下功能:在首次进入汽车时,通过配套智能手机和/或平板电脑应用程序,用户即可获得新车、智能助理及汽车主要功能的全面介绍。获取基于来自汽车传感器的情境智能汽车信息,以帮助驾驶者了解汽车状态,例如警示灯和错误信息以及应对方式。此功能支持多模态交互,驾驶者可以使用语音和手势指向警示灯并提出问题。使用语音就能够对汽车功能、潜在问题、警示灯等问题进行直接查询,在驾驶时,用户可以聆听Car Learning模块以了解汽车信息,能够根据汽车警示提醒及诊断信息预约经销商进行维修和更新。主动分享信息,以确保驾驶者可以获取隐藏在汽车复杂菜单深处以及通过OTA提供的新功能。Cerence作为一家独立上市的下一代汽车软件公司,在人工智能出行语音助理方面已经为奥迪、宝马、戴姆勒、丰田、福特、吉利、上汽等品牌近3.25亿辆汽车提升车辆智能化水平。面对自动驾驶、共享汽车、电动化,Cerence在其全新的汽车领域有了更为深入的思考。通过全新的多模态交互解决方案,引入多感官、对话式的体验可以极大的提升乘客与车辆之间的信任关系,而这也是L3级别及以上自动驾驶汽车及未来车载体验的核心所在。