AutoR智驾 2021-05-26 15:29
吉林大学高振海:智能驾驶多目标决策算法开发
分享
我们团队一直在攻克一件事情,希望提出自己以人为本人车路闭环的控制理论,并应用到自动驾驶当中去。植根于驾驶员自然行为下的理解包括控制,驾驶员人性化、个性化的规律机理是什么样?好比我在做车道变换的时候跟你在做车道变换时有不同控制行为规律怎么去做。

首先有请本次论坛的主席吉林大学汽车工程学院院长、汽车仿真与控制国家重点实验室主任高振海教授致辞!

    

高振海:谢谢大家!大家都是学者,大家都是希望做研究的,把自己的研究做好是重点。现在从事一些行政工作,我觉得行政工作是给大家做贡献了。包括这次论坛的组织工作,前期组织工作感谢邀请的各位嘉宾,感谢你们在今天上午对技术的分享,也感谢宏宇做的组织工作,也感谢学会给我们提供这样的平台,让大家做很好的交流。

    

回到技术本身,今天给大家分享的内容是,我们希望在智能驾驶的研究过程中,能够把人的行为规律找到。我们这一段时间一直在思考一个问题,现在的智能驾驶已经从一些常规的,在一些标准化道路上要走到更多极限无穷场景下的东西,无穷场景下行为决策到底怎么做?我们不能用常规方式做决策了。需要回到找到人类本身开车是怎么想的,在人类本身行为做精准化表述,使得自动驾驶走得更加无限场景下应用怎么去做,这是我们这几年重点在探索的事情。

    

我来自吉林大学汽车工程学院,我介绍一下我们学院。我们学院是原吉林工业大学,1988年组建了中国的首批建设汽车重点实验室。现在我们学院在有百余位的老师,160多位专职老师。应该讲汽车领域中十全的方向,本科生2100人,研究生1100人,每年会毕业400个本科生跟300个研究生。

    

我所在的实验室,我本身在94年读研究生开始一直在汽车仿真控制国家重点实验室工作,我们实验室主要做三高的研究。高精度的车辆动力学的建模,从整车到底盘到车身到发动机整个的车辆的运动学、动力学的建模。我们人车路闭环系统去做,去把路高逼真度路场景建模,包括水平、越野、结构化道路和非结构化道路的建模。同时我们更研究人,我们需要建立高行为驾驶员建模,进而研究底盘车身动力传动技术。

    

回到研究本身上来,这次跟大家分享的是我们怎么开展这个研究的,我们在这一段时间基于这个类人决策方法,我们做些什么事儿。也想跟各位同仁们分享,我们从去年开始正在探索的事情,有一些出来论文了,有一些处于研究的阶段。

    

首先是研究的背景、历程。我们一直在说把自动驾驶称为感知决策控制对人也是这样的,人是通过对道路信息的感知得到驾驶信息,基于驾驶信息之后人会做轨迹决策,方向、速度都在轨迹里面,会得到驾驶员心目中理想的轨迹,针对这个理想轨迹,人会对自己的行为进行控制和修正,最后作用去车,车产生汽车运动状态最后再反馈到整个道路的环境中去,这是人本身产生的行为规律。

    

在这个行为规律基础上,我们实验室从郭院士在94年到吉林工业大学开始,我们一直在研究自己的驾驶员模型。郭老师1982年提出来驾驶员方向控制模型,针对一条既定轨迹条件下,驾驶员怎么控制汽车行驶方向。在1997年时,跟着郭老师读博士时,我们开始探索,如果没有既定轨迹怎么去做?怎么根据真实道路环境,包括车道线信息、障碍物信息,做驾驶员方向与速度综合控制。当时我博士毕业论文写的是“我们自己的驾驶员方向与速度的综合控制模型”,我们希望基于车道线信息做轨迹动态决策。我读完博士后之后一直在探索真正的驾驶员拟人化的控制怎么去做,我们希望把驾驶员自然驾驶行为机理跟本能规律,包括对行为控制机理应用到自动驾驶当中去。

    

因此,同时我们从05年开始,因为我们一直在做底盘动力学。我们是从底盘的控制角度讲,因此我们在读书的时候,我们车辆学科或者我本人读书的时候,是植根于地面运动学和系统力学。因此94年开始跟着郭老师是把人、车环境闭环系统形成动力学的理论,在这动力学基础上,所有智能驾驶研究是围绕底盘控制和运动学、动力学集成开发去做的。我们00年提出高速汽车辅助驾驶系统,当时申报第一个教育部项目,我们名称是高速汽车辅助驾驶系统,那时候希望用辅助驾驶系统实现蛇形汽车操允型的控制,11年我们希望把底盘一体化控制,我们希望未来汽车侧重三向一体化调控,利用运动学方向实现驾驶控制。人的运动行为是什么样的(16:41)。

    

00年到11年重点攻关自动驾驶安全行驶,15年探索自动驾驶怎么有高长远体验感,这也是这几年我们努力在攻关的点。

    

我们团队一直在攻克一件事情,希望提出自己以人为本人车路闭环的控制理论,并应用到自动驾驶当中去。植根于驾驶员自然行为下的理解包括控制,驾驶员人性化、个性化的规律机理是什么样?好比我在做车道变换的时候跟你在做车道变换时有不同控制行为规律怎么去做。

    

同时我们希望基于人的研究提出让人类接受自动驾驶算法是什么样。

    

在这个上面,我们是提出了我们自己的概念。刚刚我说传统做自动驾驶时分为感知、决策、控制,我们更加细分为五个环节,我们自己搞车辆专业,我们媒体采访时总说AI时代我们要做什么?我的团队我们没有在做感知算法,自动驾驶车道线检测、障碍物检测我们没有做,博士后的时候我们就做过,但是回到车辆专业之后,我们没有做感知的事儿。但是我们希望感知之后的事儿我们会去做,把感知环节分为感知的增强跟认知的预判,增强是因为我们想基于视觉雷达,包括毫米比雷达做多传感器融合的认知,认知下做融合的预判,我们期望建立前视预瞄特征认知,(19:11)跟底盘的线控执行怎么去做,我们希望宜人运控中研究人本身应该有的或者人本身适应的操控风格是什么样,我们来做。所以我们提出一体化基于安全、舒适、节能包括合法这种驾驶目标,而且是能够模拟一个真实驾驶员甚至不熟练驾驶员和熟练驾驶员行为的汽车运动学一体化实验的方案。

    

在这个基础上,我们就建立了自己从感知层到认知层到决策层到运动控制层、线控执行层五层自动驾驶整体决策算法。实际上在认知层,感知层大家做得都是一个样,但是我们觉得高精地图也是传感器。认知层主要做了前方障碍物动态预测,包括对自车状态动态的预判,最后我们会生成我们自己的驾驶的动态地图。基于这个动态地图建立围绕安全、功效、合法性。我们是开放体系,我们进行动力学的协同决策,我觉得方向、速度要耦合一起去,到底方向、速度怎么解耦去做。下面是执行的线控型,这是整体方案。

    

下面我重点跟各位分享我们在做多目标决策时我们怎么做的。

    

我们一直研究人车路闭环系统,人车路闭环系统的研究是真正使得自动驾驶真正上路的必须要研究的事儿,因此我们进行了精细化的分享。我们首先去研究路,道路、交通、环境实际是给人和车行驶的约束,包括区域的安全性。好比说它实际上就是约束我怎么能够安全的去开车,然后我觉得车本身角度讲,车本身有它的极限能力,车不能像直点,从A点直接跳到B点,它必须有发动盘或者发动机钮距输出,所以汽车有它的运动期限能力。我们经常说原来路径规划、行为决策实际是把车当成四轮的轮式机器人,但汽车本身实际是运动学、动力学耦合到一起的事儿,汽车不可能一下子转弯或者一下子加速,需要缓慢加速,在做决策时一定要考虑汽车约束能力的(22:30)能不能通过我的操控,在什么时间下达到这个点。同时更加研究驾乘人员的体验感,人对这种决策行为的接受性跟他这种人性化的感知怎么做,最后建立环境约束、操控能力、实施性安全性整体评价做分析。

    

基于这个分析,我们一直在研究到底这个人在开车时人是怎么去开的?我们经常说人是前视预瞄,人看前面的路是什么样的特性,决定当前怎么开车。我们首先研究人怎么瞅前面路的?我们测试了人在开车时的关注,如果前面公路干净的情况下,人的前视点关注到哪个点上去,人关注的点他就跟着那个点开车了,因此研究人前视点运转规律,包括人在做跟车行为的规律,研究参数,把人的参数研究透,基于这些参数决定车的决策控制怎么去做,包括我们在用驾驶模拟去做,我们用实车场地实验去做的。

    

在这个基础上,我们就构建了我们自己的我们叫驾驶员的类人控制的一套架构,我们希望建立出拟人化自动驾驶控制架构。这跟前面说的驾驶员行为是一个样子,首先做人的行为感知,人的行为感知我们去研究理解交通法规,需要合法性开车,然后我理解车上其他交通参与者,包括行人、其他车辆、障碍物信息,然后知道前面车道线信息,同时知道自车状态信息。我们进一步研究的是我得知道前面路面坡度以及平面的信息。

    

在感知之后,我们重点是基于汽车运动学和道路几何特征做轨迹决策,

这个时候我们叫做汽车动力学和运动学的解耦,汽车动力学特别复杂,需要有很多的环节,因此我们希望决策环节中,相当于在天上看这个车怎么做决策,我们把车理解为一个运动的物体,当然它是转向加速驱动受人限制,所以我们研究的是汽车运动学的行为决策。       

    

环境感知信息会给我可行驶的区域,路给我约束条件。在这个约束条件上,我们会根据自身运动状态,形成了我们本车对未来预计形成轨迹的预测,到底是什么样子的。形成这个预测,我会生成一个待决策的轨迹结合,我要找到最优点怎么去做。如果找到最优点,我们希望车的加速、减速用的是最小化完成动作是最好的,把预操作性理解为成人的舒适型。最好汽车行驶中不频繁的加速、减速,而且能高速的完成驾驶任务,这是一种最好的决策性。

    

我有自己的功效性的东西,我去用最高行驶效率完成,同时需要合法性。基于开放性指标决策体系,我们建立模糊多目标决策的方法。因为模糊多目标决策,大家在统筹学或者控制学当中有很多的方法,具体方法我不去说。但是我们确实希望模拟出来,因为每一个指标之间人怎么去权衡它,好比人对安全性、合法性考虑,人都有自己的想法。怎么通过评判把这个想法建立出来,这是研究的点。

    

我们得到预期行驶最优的轨迹点在什么地方,基于这个轨迹点,我们会讲这个点产生什么样的方向盘或者加速制动的动作才能到达这个点。我们建立基于汽车动力学测重向控制,好比前面有减速带的时候,我过减速带时我的速度已经减到合理过减速带位置上去,不是把这个东西放到控制环节中被动去实现,而是主动规划中去做。

    

最后要有控制动作的执行,我们希望把人的一些运动控制的规律包括神经反应、动作反应规律融合到现代自动驾驶中,汽车不要转的太快,人需要熟练的转弯。转弯来回急转也能过,缓打也能过,这时有神经反应去适应这个事儿。这个在控制环节中需要去考虑的。

    

在这个基础上,前面路给我了预期的行驶轨迹,在人的眼前展开了网格,这个驾驶地图中每一个点都是未来要达到的点,预计轨迹点就在这个地图上去找。这个地图上哪个点是我最优的点,相当于所有红颜色的网格给了我一个集合,这个集合中要找到最优点,这个最优点要基于一系列的指标,每一个点对应的安全性是什么样,对应的功效性和合法性是什么样的?我们来基于这种方式进行轨迹的决策。

    

在这之前我们一开始建立网格时很简单,但是我们从去年开始我们试图建立一种更加具有环境态势的风险场概念,希望从认知层得到交通态势评估,建立交通态势场,基于此形成行为。原来做驾驶员行为时工况相对简单,但是现在希望决策算法融入到真正车流中去,前面的动态驾驶地图建立就一定有一个整体风险场的理解。我们建立复杂环境过程中风险场的建立,把原来动态地图建立得更加精细化。

    

这个基础上我们提出了从安全到合法,一个车最左下角的车是汽车预期达到的位置,这个位置它所跟它的前方、侧方,跟左右两侧的车道线之间给我的约束条件是什么?我们建立出了安全性的评估体系。我建立出来汽车跟前面网格中每一个点它所带来的左侧安全、右侧安全和前方安全是什么样。左侧、右侧安全来自车道线约束,前方安全是来自于前方其他车或者在急转弯时前方的路对我也是一个约束条件,所以我们建立出了这种基于车本身到车道线障碍物之间的距离,基于距离建立运动学特征安全性指标,通过这些指标我们最后分析一个车到底是什么样,进而进行轨迹的决策。

    

我们在基于这种决策的方法,我们把这个决策方法应用到整个从辅助的预警到辅助驾驶一直到自动驾驶整体环境中去。这个是我们05年做车道偏离须系统,当时跟西交大老师一起合作做的。在做的时候建立了只有前面的那张图,我建立出左侧、右侧跟前侧整个驾驶安全性评价指标。基于这个评价指标做车道偏离预警到底是什么样子。

    

同时应用到HCA控制,一个是安全、合法,在安全合法的前提下怎么使得我的动作更加不频繁加减速,我们形成了动作的列表,动作列表包括了先过安全性、合法性的门,安全、合法驾驶是汽车行驶的前提,安全合法行驶前提下,我们研究人、车怎么更加舒适性,汽车怎么高效节能使得自己的驾驶?我们建立这样的分层的决策方法,我们去做这样的事儿。

    

基于此,我们整体从辅助预警到辅助控制到自动驾驶,我们建立了整体方法,我们一直在做。这几年我们研究我们自己的驾驶员行为体系去做这些的研究。包括我们跟一汽,在红旗上做的所有辅助驾驶,现在我们正在做红旗汽车L3自动驾驶。

    

我一直觉得高精地图是辅助的东西,只要建立出来整体车道线监测信息,因为我觉得人在做驾驶时人也不依赖于地图,我们一直希望摆脱对高精地图束缚下的研究,我们怎么去做。

    

下面给各位分享我们从去年开始正在做的研究,当然我们这个研究已经有几篇论文已经在发表中,但是还在做探索的阶段。

    

第一个探索的阶段.从去年开始我们一直在研究责任敏感安全模型,责任敏感安全确实需要做。尤其面临有限场景到复杂道路交通环境下形成的无限环境场景。原来有限场景是每一个场景都是基于工况性的设计,但现在自动驾驶的决策没有工况了,这种情况下怎么做?从有限场景到无限场景,我们想建立基于无限场景特征的形式化表达。我们特别希望跟同业们大家一起构建出对交规包括人的模型去建立能够被全行业普遍接受的普适性的安全决策的行为规范,这是我们在这两年一直在做的。所以我们去研究类脑、类人和类社会的决策到底怎么去做,我们希望把人放在人车路大环境当中去,人与其他车交往中去建立决策规则。

    

我们探索的第二件事儿,前期我们做决策时一直希望汽车是钢体,钢体实际只是一个运动学,只是加速度、减速度,是速度和位移的东西。但是我觉得汽车行为规划应该变得更加精细化,因为汽车它的加速,它的转向是有一个动力学规律,希望把动力学规律引入到决策中去。我们提出来要建立自己的自动驾驶运动控制服务,因此我们希望这种运动控制的服务,能够使得我的运动规划得到进一步的修正。我不是把车理解为简单的钢体速度的加速度,这个速度加速度是来自于汽车本身自身特性。

    

如果一个解放或者一个红旗,一个捷达,一个宝马,它的加速度、减速度不一样,它的轨迹规划应该有不同理解去做,这是车本身带的理解,因此我们希望建立动力学特性的精细化。

  

我们一直在做汽车本身状态的预测包括航拍角度、摩擦系数,原来的自动驾驶一直在做在平面路面上做行驶,我们现在要走有坡,这种复杂的关系怎么做决策?因此希望把原来动力学感知引入到决策环节中去考虑出来。

    

第三个问题这也是我们从去年开始真正在去做,我不知道大家做没做过统计?美国在去年做过统计,全美国在做自动驾驶车测试的时候,22%左右的人是有晕车的行为。当你从开车变成乘车的时候,我们不把方向盘了,晕车行为变得更加常见,因此希望场景规划环节中去研究感觉冲突理论,基于感知冲突理论研究,我们希望建立出来能够主动延缓或者主动规避运动乘车晕车程度的驾驶决策,我们希望把人的规律进一步导入到决策中去,我们去研究人的模型,去研究人体头部的模型,人体头部模型基于这个前庭模型规律,把它导入汽车钢体运动中去建立模型。

    

第四个,我们希望我们的方法能够把车体去用。所以我们现在跟几家车企在探索我们的决策行为的主观评价,原来主观评价是大家拍脑袋去想,现在希望建立基于实验心理学描述的主观评价,同时实现客观定量化的分析,这也是我们着力在探索的事儿。

    

做总结,我心目中的自动驾驶是什么样?我一直在思考原来汽车理论和现在的智能汽车理论区别在什么地方?原来的汽车场景的设计是基于有限场景设计,现在自动驾驶汽车设计基于无限场景进行的设计。原来的汽车设计理论它的信息是来自于轮胎与地面,来自于车本身。

    

现在我的信息可以有预见性,我可以知道前面是什么样的路,我知道前面是什么样的弯和坡度以及湿滑程度,不用单独根据车进行感知,现在可以预见感知。

    

原来车出厂就固化了,它所有行为规律设计都是固定下来的,现在我们已经有OTA,我们可以进行远程的升级,我们可以去知道你怎么去开车,基于你开车行为来进行个性化控制设计,我们现在可以进入到使用阶段也可以去做它,当然整个开发应该做数字化开发。

    

所以我们希望探索五化下自动驾驶设计理论及控制方法。这是这两年我们着力做的事儿,也希望跟同事们做一个分享,谢谢大家!

x

收藏 0
打赏
相关标签:
电话:010-65030507
邮箱:editor@autor.com.cn
地址:北京市朝阳区朝外大街乙6号朝外SOHO D座5097室
北京智驾时代传媒科技有限公司          Copyright © 2014 - 2022
Autor.com.cn All Rights Reserved. 版权所有 AutoR智驾 智能汽车网
京ICP备14027737号-1      京公网安备 11010502038466号
电信与信息服务业务经营许可证:京B-20211307
关注官方微信