智驾网 2023-10-27 11:34
携星火大模型,科大讯飞杀入智驾市场,推出两套纯视觉解决方案
分享
​两款智驾解决方案——智驾STD和智驾PRO展示了科大讯飞向舱驾一体进发的决心。科大讯飞智能汽车事业部总经理刘俊峰评价旗下智驾方案时表示:“虽然来得晚,但表现并不差。”

10月24日,科大讯飞发布了讯飞星火认知大模型V3.0,从今年上半年推出至今,迭代至第三代,其进展之快令人称奇。


在科大讯飞董事长刘庆峰表示,讯飞星火认知大模型V3.0对标ChatGPT,并赋能各行各业,同时推出面向教育、医疗、汽车等众金垂类行业的通用应用。


针对智能汽车,当天下午,科大讯飞发布了基于讯飞星火V3.0的智驾、座舱、音效三大方向的产品升级。


其中,两款智驾解决方案——智驾STD和智驾PRO展示了科大讯飞向舱驾一体进发的决心和技术实力。


这是在智舱领域深耕多年后,舱驾、行泊一体的融合方案正成为市场主流,科大讯飞终于向前再迈一步,从语音识别、语音控制再到语音交互,最终突破座舱限制,进入智驾方案。


那么科大讯飞的这一套智驾方案有什么特点呢?


我们先来看一下两款智驾产品的硬件配置。


智驾STD:5颗毫米波雷达+6颗摄像头、算力15+TOPS、可实现包括高速NOA、自动泊车、确认式变道等功能。


智驾PRO:5颗毫米波雷达+11颗摄像头、算力50+TOPS、可实现增强型高速NOA、确认式变道、记忆行车灯功能。



简单的说,这是两套都不需要激光雷达,以摄像头为主的视觉智驾方案。


那么星火大模型V3.0对这一方案有什么助力呢?


科大讯飞解释说,大模型利用海量数据以及驾驶领域知识的强化,可以用于自动驾驶场景数据以及驾驶策略的生成,并支持以交互的方式增强对基础驾驶模型的理解。


针对汽车,科大讯飞自研了从深度学习训练到模型调优量化、模型推理部署的全栈工具链,并打造了智驾应用开发框架和中间件,确保系统稳定,支撑跨平台算法快速移植。自研4D重建与自动标注系统有效提升了标注的效率和质量。



星火大模型将从技术架构层面赋能BEV+transformer智驾感知大模型的研发,解决智能驾驶当前存在的感知不精准、决策不智能、长尾不收敛三大技术难题。


通过统一的BEV+Transformer网络,可以实现多模态、多任务、长时序4D感知。


结合星火座舱的人车交互能力,大模型将舱驾信息进行深度融合,加强人车交互性能、提升用户体验,用户可以自由下达车控和智驾相关指令,车内外语音交互均可实现,行泊流程自如可控。



在发布会现场,科大讯飞展示了该解决方案在合肥市内高架路段的实时行驶体验。


视频内展示了搭载科大讯飞智驾解决方案的车辆在进出匝道、躲避大车、主动变道、车道保持等方面能力,其行驶体验并不弱于主流智驾公司。


科大讯飞智能汽车事业部总经理刘俊峰评价旗下智驾方案时表示:“虽然来得晚,但表现并不差。”


对于这一智驾方案,刘俊峰没有公布它的成本,但鉴于没有激光雷达版本,其产品定位将追求性价比。


目前,上述两款智驾产品尚在工程车测试阶段,并未公布未来搭载车型,但与诸多仍在死磕主机厂定点的智驾公司不同,老江湖科大讯飞一贯人缘不错。



发布会现场包括奇瑞汽车、长城汽车、广汽、一汽红旗等诸多企业成为首批星火汽车行业合作伙伴。


这显然是因为飞鱼OS不小的朋友圈。


而在本次发布会现场,科大讯飞同时发布了其在智能座舱领域的最近产品:星火座舱OS、星火汽车APP和星火座舱域控。



星火座舱OS包括星火汽车助理和星火场景应用两大部分。


其中,星火汽车助理可以通过十轮以上的上下文语义继承指令,完成诸如打开空调车窗等任务和信息检索、知识梳理等工作,并通过视觉模态对驾驶员进行疲劳检测,通过多模态识别进行车主ID认证以及识别车主情绪。


此外,星火汽车助理还能完成包括行程规划、内容创作、电话纪要生成、壁纸创作、外语口语训练等诸多基于星火大模型的相关功能。


而星火场景也正式基于大模型赋能,打造了多个沉浸式的使用场景,并支持自定义,一句话生成复杂场景,触达200+车控动作。


正如科大讯飞董事长刘庆峰所说,每个人都拥有AI助手的时代正在到来。


而星火汽车APP在提供如用车顾问、儿童故事、口语陪练、旅行伙伴实用功能之外,还可以实现迅速装车迅速更新,降低用户的使用门槛,扩大用户群体。


星火座舱域控则面向车企合作伙伴,基于全栈的座舱AI算法和结合芯片的异构算法优势实现芯算融合,大幅度提升国产平台的渲染效果,旨在以更少的资源、更短的开发周期实现差异化产品创新。


目前科大讯飞智能座舱与百余家企业生态积极合作,同时其软件生态已相当丰富。



在音效方面,科大讯飞发布了最新的iFlySound Plus24ch功放硬件平台,在保证性能的前提下,有效降低了硬件的尺寸和重量主打“小型化轻量化”。


通过自研高阶音效算法,该平台可实现包括3D环绕、声场分区、ICC、响度补偿、主动降噪、虚拟音效、多音区交互、高拟真主动声浪、车内交流偿、低品质音源修复、场景增益控制、声场分区、车载K歌和大模型音效在内的多种功能。


此外,基于大模型声学理论体系实现人机耦合,端云协同AI调音,基于iFlyDSP GUI工具,无需代码更改,可以快速完成定制需求。



目前,科大讯飞已为数千个车型提供业界领先的智能语音交互服务,累计服务用户已经超过4610万,在国内汽车智能语音应用市场保持占有率第一。


随着讯飞星火认知大模型的发布以及超越常理的迭代速度,也给了科大讯飞智能汽车事业部更多的信心,同时顺应舱驾一体的技术趋势,开始跳出语音交互这一细分领域,开始慢慢提供完整的智能汽车软硬件解决方案。


这意味着科大讯飞将不仅仅局限于做为一个智能座舱供应商出现,而慢慢向智能汽车底座的解决方案提供商转变。

x

收藏 2
打赏
相关标签:
电话:010-65030507
邮箱:editor@autor.com.cn
地址:北京市朝阳区朝外大街乙6号朝外SOHO D座5097室
北京智驾时代传媒科技有限公司          Copyright © 2014 - 2022
Autor.com.cn All Rights Reserved. 版权所有 AutoR智驾 智能汽车网
京ICP备14027737号-1      京公网安备 11010502038466号
电信与信息服务业务经营许可证:京B-20211307
关注官方微信