智驾网 2023-06-15 11:47
滴滴自动驾驶COO孟醒:从自动驾驶技术转向自动驾驶服务
分享
新一代车我们希望做三件事:首先是无人化运营服务,第二是不断提升无人化的研发能力,第三是经过整个车流程。

以“5G大时代,勇闯无人区”为主题的2023世界智能驾驶峰会在北京国家会议中心成功举办。本次峰会由智驾网策划,智驾传媒与中国邮电器材集团有限公司共同承办。


今年是峰会举办的第五届,从2018年首届峰会举办至今,智能驾驶正从L2级别辅助驾驶逐渐向高级智能驾驶进化,拥有智驾功能的新车渗透率逐年增加。同时,芯片、激光雷达、高精地图、高精度定位等相关产业链也正迎来爆发式增长。


本次峰会设《智能驾驶的中国方案》、《高阶智能驾驶的落地之战》、《无人驾驶的商用车落地场景》和《智驾产业链的全球化与本土化》四大版块,汇聚100多位产学研代表共同分享、探讨行业现状与未来发展。


在论坛现场,滴滴自动驾驶COO孟醒发表了相关演讲,以下内容为演讲全文,本人未审核。


微信图片_20230607141833_副本.jpg


孟醒:各位早上好,我是滴滴自动驾驶的首席运营官孟醒,很荣幸跟大家分享一下滴滴自动驾驶在这几年里,我们在做自动驾驶、无人驾驶方面的探索。自动驾驶里面遇到的问题不光是技术问题,还有产品、运营、服务,滴滴本身是做服务的公司,我们的出发点就是从服务出发,倒推我们应该做什么样的体验,交付什么样的服务给大家,所以今天的主题是从自动驾驶技术到自动驾驶服务。


滴滴自动驾驶在六年半之前成立,我们经历了几个阶段。最重要的一个里程碑是在2020年的时候从研发阶段走入到了开放自动驾驶运营,也就是可以把我们的服务提供给乘客,第一次我们是在2020年6月份的时候在上海开放了我们的运营,到现在已经是接近3年的时间了。这3年时间里,1020天,现在又超过这个数字了。一千多天的时间里,我们团队从小几百人到一千人,关键接管率张了几百倍,技术指标提升得都非常好。


今天主要想分享的是,当我们看待自动驾驶这件事的时候我们已经不光是在研究技术上怎么拓展了,我们在想下一步我们交付的阶段应该是自动驾驶服务。从自动驾驶到自动驾驶服务只多了两个字,但这两个字的意义在于我们看待这项能力或者这项技术的时候,视角是从车的视角变成了体验的视角,从车的研发人员视角变成了乘客的视角,我们从乘客的视角倒推我们需要什么样的体验。


在这一千多天里面,车在路上跑,有很多人在问我们,给我们提很多意见,这是我们运营最大的目标。今天无人驾驶服务目标不是为了赚钱,我们还在测试阶段,测试除了在技术验证以外,最大的意义在于收集用户的反馈,尤其那些要求非常苛刻的用户的反馈,这些才能帮助我们进步。用户提了很多反馈,比如说舒适度的提升,站点能不能提升一些,车的价格怎么样,能不能买一辆回家当toC的车开,我们不能卖,现在还在测试阶段,而且我们是出行服务的公司。但是很多客户的需求我们往新里去了,排了优先级,根据用户提出的频率。大家要求最多的是区域能不能大一点,这是服务需求,严格上说从技术服务上讲我们在一条路上做和在一个区域做,这个完全取决于用户。


微信图片_20230607141841_副本.jpg


我们自己在测试,为什么用户还需要我们做更大的需求?很多用户把我们自动驾驶车,今天在上海、广州开放的区域里当作他们日常通行的唯一工具,有的时候是主要工具。他自然不想改变,你既然能帮我们从家里带到单位,带我到吃饭、娱乐的地方,我想他们是希望把自动驾驶服务纳入到正常生活的。


以上海区间为例,我们一千多天前覆盖的这么一小片区域,十公里左右。到后面的时间点,不到半年时间我们扩张到了五十多公里,去年年底覆盖了三百多公里的范围,整个路线长了7倍,在3年里面。上海开放的路径现在比这个还大,我们当时原则是开放多少我们就覆盖多少,今天开放的区域已经非常大了,上海有上千公里的道路,有的是比较偏远,用户人群密度比较小的区域,我们的原则是用户需求到哪儿我们就开放到哪儿,把用户需求串联起来,这是我们开区域的速度。


开区域只是一个里程的体验,当你覆盖更大区域的时候,很多区域是很难进去的,这些区域里面车况比较复杂。这个地方平常是要直行通过的,但是所有直行道都被临时停车的车站住了,因为这里是个学校,下午四点的时候家长会把车停在路口,所以就没有直行道路了。对于人来讲挑战也很大,我们怎么交互、应对,这是一个例子。


再一个例子,夜市,这是在广州,晚上夜市经济发达,从经济角度来讲是好事,对自动驾驶来说是噩梦,白天能开的道路晚上变成了摊位,而且还会有人从这里蹿出来,有时候看不见的,因为挡到摊位的后面,因为这些都不是在人行横道发生的,在你意想不到的地方,而且每天摆的摊位位置还不一样,这样的场景是我们扩大路线以后带来的代价,不光路程多,而且场景会更加丰富。


这样的场景有很多,有窄路口,有交互逆行,特别宽的路口一眼望不到长什么样的,车路协同能力对这样的场景会有所提高,不管怎么样场景会变得越来越复杂,这只是一两个城市里面,我们扩大到更多的城市里面,场景会变得更加复杂。


我们怎么办呢?我们做了一个针对于城市场景的东西,解决交通流更大,车辆更多带来的问题,参与者,交互者更多。这里有感知大模型和预知大模型,虽然叫大模型,跟ChatGPT比并不是一个概念,但是确实是这样来搭建的一个模型,核心解决的问题,比如原来一个路口可能20个交通参与者,现在交通一个路口有200个参与者的时候,我们能在没有延迟的情况下把所有参与者的行为跟踪下来,并且一次性把行为预测下来,可以把所有交通参与者可能跟我们交互,用最短的时间,有限的算力解决掉。


微信图片_20230607141846_副本.jpg


第二个是交互,进入到这些场景里,汽车跟非机动车必然要产生交互,没有很好的隔离带,甚至有些在老城区里有逆行的车辆,路权设定理论上不应该出现的情况下,需要用合法的方式交互,这样交互的情况也会比较复杂。我们有两种方式解决,第一种方式,理性交互我们引入了博弈论的方式,如果我们让行,对方会不会也让行,对方让行我们是不是应该抢进一步,我们把多轮博弈的能力放入到算法里面来,这对于算力的挑战是比较大的,过去做单轮的交互就已经吃满了算力,做多轮的时候要优化模型。第二个是非理性的交互,因为人做很多决策的时候也不是按照特别理性的方式来做,我们引入了模仿学习的能力,学习人类怎么开车,不管人类开车的结果是否合理,我们先去学习它,我们知道它,部分来模仿它,预测它,把人类驾驶的行为习惯放在模型里。


还有更多的长尾场景,场景到深水区以后会碰到的场景,平常不太容易碰到的。我们又分成两类,一类是分辨得很清楚的场景,比如说施工区域,异形车辆,洒水车等等,或者一些小动物等等,这些人是马上可以分类的,而且知道是什么样的,可以挖掘出来信息。这里我们用了主动挖掘,过去主要分析的数据是监管数据,碰到问题以后把数据拉出来看一下遇到了什么问题,现在我们可以说碰到一个小狗,这个小狗Case处理不好,我们在所有数据里挖掘,只要出现狗的场景马上给调出来,并且把它归类,我们甚至不用给这样的指令,机器自己会发现我们在接管的时候哪些场景做得不好,并且把这些场景涉及到的所有元素在历史上的所有数据里重新挖掘一遍,提炼出来再放在一起,这样大大增加了可训练的场景,把它分类好。


第二种是压根不好分类的,比如说各种异形的塑料袋、水坑等等场景,说不上来能不能变成一个类别,我们需要的能力是不分类,不识别也能把它安全度过,这个是应对更长尾场景的一个能力,也是城市里面非常重要的,我们用了占据空间的方式去解决,从视频的像素点来预判接下来占据空间的东西可能在下一步的行为和变化。


这些东西加在一起我们叫城市泛化引擎,这也是能带我们到更多地方,更多区域的核心能力。


乘客提的第二个需求,除了区域能不能更大,站点能不能更多一点,这个也很好理解,我们坐公交车的时候,通常500米一个站点,如果你要去的地方是在两个站点之间是很容易选择的,可以选A也可以选B,但是很多人是在这两个站点之间,或者偏向哪块,偏向中间一点的位置,他们会纠结是在A还是在B去坐。网约车今天已经没有这个问题了,网约车哪都可以停,但是自动驾驶今天的站点还没有那么丰富,我们还是选择固定的站点停。当我们现在一些站点的时候不像公共交通设施,有很好的站点做一个港湾出来,我们选的很多地方可能就是一个道路的路边,这个路边我们想要用的时候可能被自行车、摩托车占了,或者临时停车占掉了。占掉了以后自动驾驶很难停进去,本来站点密度就不高,这样又少了一个站点,体验更差。


即便有人占道,我们能不能尽量在有空间的范围内把车停进去,这件事情我们过去做了一年。只要车的空位还在,哪怕前后距离窄,我们也可以泊入,这个比例达到96%。网约车,看滴滴有一个很著名的东西叫小绿点,经常上下车的位置。这个密度大概是10米一个,而整个行业开放自动驾驶区域,平均一个站点平均1.5公里一个,也就是说网约车的站点密度是自动驾驶服务的150倍,这对用户体验来说也差150倍,我走一段地方才能上车、下车,这个体验是过关的。


怎么解决这个问题?能不能增加站点,把所有小绿电的地方都增加为站点,可能也不是很好实现,因为有些地方不适合停车,必须有人的交互,比如说你需要跟门卫打招呼才能停的地方,自动驾驶没法做这样的动作,所以并不是增加每个站点都合适。有没有更好的办法?我们做这样的行为,我们做了无限泊车,把所有的路都变成了可停车的位置,也就是说没有固定站点,可以在任何地方点一个站点,这个点可能可以停可能不可以停,但是车开到那儿的时候会告诉我,能停就直接停进去了,如果不能停,会找旁边最近的50米、100米、250米范围内的点,这跟正常叫车的APP不太一样,网约车停的位置可能没有划好车位的,但是只要网约车形式能停进去就争取把它放进去,这是无限站点泊车能力。


第三个点是说大家希望我们提供24小时的服务,自动驾驶本来就是一个测试阶段,为什么要提供这么长时间的服务呢?因为白天用惯了,晚上出去玩回来也想用,这个能理解。但是晚上有很多问题,晚上的交通量不多,大概是白天的40%,下降了60%,但是致命的车祸占比并不少,占到40%。因为晚上能见度低,对人很难对车也很难,第二个是疲劳驾驶,疲劳驾驶可以很好的解决,因为这里没有人的因素。但是能见度低,这个对于传感器来讲很有挑战,我们的摄像头在这样的场景里,人看不见黑暗的区域里有没有人,摄像头也看不见。我们在新一代硬件里加了红外传感器,我们应该是国内第一家在L4里加红外技术栈的。本来在黑暗里的人现在就可以看到了,不光看到还可以看清,因为红外分辨率很好,可以看到这是两个人,是在正面还是侧面。


基于红外再配上一些算法,晚上可以做了,但是车能不能承受得住24小时连续的运营?自动驾驶在路上有开车的挑战,车还要去维护、保养、充电、清洗,车没电了谁来管?白天的时候司机可以去做,24小时,不可以每一个环节都有人,车脏了怎么办?是接下一个乘客还是去清洗。车外脏了无所谓,车里面脏了呢?车得知道,得回复。基于这个需求我们又做了一个创新,可能是全球第一个自动驾驶运维中心,我们第一个设在了上海嘉定慧桔港,自动驾驶车发现自己没电了,自己脏了,会知道这个信息,发一个请求给运维中心,会给它排个班次,什么时候回到中心维修保养,有点像换电站,自动驾驶网约车可以在路上开的时候进行排队,到了它的班次以后自己会开回来,它的转弯半径比正常车要小,我们用清洁机器人来做清洗,清洗完之后进行充电,这是由机械臂进行的,充电桩是滴滴旗下的小桔充电提供服务的,有一个灵巧手把盖翻开,把充电枪加进去。未来的设计里面,我们会把这些考虑进去,下一代车可能会比这个更加简单。


所有工作做完之后,又是满血的状态,可以出门继续接单和服务,这是我们希望看到的连续的服务,真的做24小时,这是必须要考虑的,可能不一步到位全部无人,但是在无人化的运维舱的研发和无人驾驶的研发必须是同步的才可能会实现,所以24小时成了我们心目中的目标。


在我们的区域里有谁是24小时在运维的?可能并不多,尤其在嘉定这些区域里,可能有木屋烧烤、全家、肯德基,还有一些24小时超市在这个区域里,我们很荣幸成为了“24小时全家桶”中的一员,我们在1月3日在上海上线了24小时无间断的自动驾驶运营服务。


微信图片_20230607141820_副本.jpg


最后就是Robotaix的数量能不能多一点,车很贵,很多不是车规级的设备,很容易坏,每辆车需要考试,有复杂的流程,所以这个挑战是比较大的。大家希望车多了以后随时随地,说走就走,所以我们的重心就放在了硬件上,怎么把车做得更好,硬件更稳定、更便宜。车经历了几代迭代,2016—2017年是第一代首批车型,能跑起来就可以了。2018—2000年的时候这代车是规模化测试车辆,变漂亮了,升级成沃尔沃60的车,这时候要开始载客,拿到了载人示范的牌照,这不是对内的测试车了,要对外,所以打开后厢盖之后车内外都很平整,没有吵闹的服务器和风扇,用户的行李可以放进去。2021年发布的双子星平台,无人驾驶测试,这个核心是增加了很多冗余,在传感器层面,在制动层面,在各个层面上面有很多冗余,这个车的能力更强,但是成本也会更高。


下一代不能往更复杂去做了,能力需要更强,但是成本要下来,所以我们提了四个点。


1、国产化。希望做到供应链自主可控,在这件事上我们上上个月跟国内非常优秀的电动车企业广西安安(音)联手打造,成立合资公司一起打造下一代自动驾驶的定制车。同时我们希望国产化的部件能到90%以上,达到很强的自主可控。


2、前装量产。前装量产不是说你在车厂里改装就叫前装量产,跟汽车生产流程完全一样,所有自动驾驶零部件相当于原车上带的零部件,一样的流程、标准、测试,才能达到足够高的可靠性、一致性,这样才能批量的成规模生产。


3、成本降低。希望降低80%,成本是现在的1/4—1/5左右。


4、安全性高。这代车不光要提供无人化的测试,可能还要提供无人化的服务。


这代车我们希望做三件事:首先是无人化运营服务,第二是不断提升无人化的研发能力,第三是经过整个车流程,能上工信部公告的车,也是标准的车,作为商用车也可以进入到有人的网约车运营网络里提供服务,所以无论是有人无人,我们希望用同一款车满足所有的需求。


最后想分享一下我们把这些事都做了,做到今天,自动驾驶服务跟有人服务还差多少?大家在这个行业里说看一些关键的安全指标、技术指标,最终我们要提供的是可以跟有人驾驶网约车媲美的服务和能力,我们到底还差多远?所以我们给自己定了一些跟网约车相关的指标来做对比。


第一个可以看送驾时长,从A点打车到B点需要花多长时间,我们请乘客反复测试,打十遍有人驾驶,打十遍无人驾驶,去年这个时间会差1.35倍,今年年初已经降到了1.2倍,作业,还是会长,我估计长期而言还是会长,因为很难达到跟人一样的水平,人有时候开车会比限速快得更快,自动驾驶是严格按照限速来驾驶的。送驾距离从1.31倍到1.17倍,现在在无限逼近人的水平,当然逼近的速度会越来越慢,因为越来越近了,我们看到这个趋势越来越近,到一定程度上人们从体验、感知上就没那么在意两者的区别了。


从用户受欢迎程度上讲,我们每小时单量是网约车的93%,还达不到网约车的程度,当然受限于很多原因,一部分是技术还在提升,送驾、接驾效率还要提升。也可以看到另外一个数,很欣喜,我们完成的单辆是呼叫单辆的1/4,从网约车的指标来讲这是很糟糕的,完单率很低,但是从自动驾驶角度来讲这是很好的事情,因为车就这么多,不是每一单都能接上,等有一天能力到了,其实有大量用户需求可以释放出来,可以去满足,需求量是非常大的。


总结一下用户的需求有几个方面:更大区域、更多站点、更长时间、更多的车,这四个我们有分别对应的能力来应对,城市方法引擎、无限泊车、24小时运营,包括运营舱、量产计划,这些事情都做到了就进入到下一个阶段,真正提供规模化、商业化的服务。


最后想跟大家分享一下一个短视频,看一下今天的状况,希望下一次在讲的时候可以展示未来的场景。这是上海上上个月拍的,从黑天到视频结束的时候还是黑天,完整的一天一辆车的流程,我的汇报就到这儿,谢谢大家。

x

收藏 0
打赏
电话:010-65030507
邮箱:editor@autor.com.cn
地址:北京市朝阳区朝外大街乙6号朝外SOHO D座5097室
北京智驾时代传媒科技有限公司          Copyright © 2014 - 2022
Autor.com.cn All Rights Reserved. 版权所有 AutoR智驾 智能汽车网
京ICP备14027737号-1      京公网安备 11010502038466号
电信与信息服务业务经营许可证:京B-20211307
关注官方微信