AutoR智驾 2021-05-26 16:34
武汉理工大学李浩然:个性化自动驾驶行为决策与运动控制方法
分享
我们提出基于改进人工势场算法的个性化轨迹规划方法。我们设计了多种典型场景的轨迹跟踪控制器,我们将场景、驾驶个性和实时性都考虑进去,对这个MPC控制器进行比较大的改进,我们研究了考虑驾驶员个性的控制。

下面有请武汉理工大学智能交通中心的李浩然演讲,演讲主题是“个性化自动驾驶行为决策与运动控制方法”。

    

李浩然:各位专家和老师大家上午好!我受褚端峰教授的委托,向大家介绍我们智能交通中心关于智能汽车的研究现状,我今天的报告偏技术一点,我主要讲的是我们怎么实现整个自动驾驶系统。

    

主要从以下几方面进行介绍:

    

第一.研究背景和意义,这个不展开讲了,前面的专家已经讲了很多了。

    

个性化的自动驾驶有以下几个意义:

    

借鉴驾驶员的驾驶经验、提高乘员的乘坐体验,增强乘员对自动驾驶的接受程度、提升混合交通环境下的交通安全。

    

现有很多关于驾驶风格、个性化驾驶的研究,但是我们发现主要有以下几个不足:

    

首先驾驶风格研究主要关注不同群体的驾驶风格分类,个体驾驶员的特征提取并将其体现在自动驾驶的决策规划控制之中研究较少。

    

还有非线性模型预测控制方法虽在驾驶员模型中取得好效果,但该类驾驶员模型结构复杂,参数标定难度高,很难运用于工程实际中。

    

现有的个性化驾驶主要面向单车辅助驾驶系统,针对高级别自动驾驶特别考虑驾驶员个性交互性的自动驾驶决策研究比较少。

    

针对以上我们认为的不足,我们对个性化的自动驾驶展开了研究:

    

首先是自动驾驶的架构。总体思路是在决策规划模块之外又加了个性化模块体现驾驶员个性化决策规划,同时对控制器进行了改进和修正,以此适应个性化的驾驶控制的需求。

    

众所周知我们的车辆控制其实是离散和连续的混合系统,比如我们做控制时我们肯定是给车辆一个控制量,这是一个离散系统。但是我们物理特性其实是个连续系统,针对这一特征我们选用专门解决离三混合自动机的自动驾驶系统架构。

    

这个是单车自动驾驶系统架构,主要有三层:

    

第一驾驶员模式选择。

    

第二是场景模式选择。

    

第三底层动力学和运动学控制。

    

这个是多车协同的结构,第一层同样是驾驶员模式的选择,第二层是车辆协同决策选择,第三层是离散场景的选择,第四层是底层的车辆运动学和动力学的控制。

    

此外,在进行多车协同控制时考虑到我们运算资源问题采用分布式控制器方法,获得环境车状态,并对状态进行预测,局部本车控制器、输出控制量对本车控制,极大提高运算效率节省运算资源。

    

我们讲一下怎么实现个性化自动驾驶决策规划与控制的:

    

首先要提取个性化驾驶特征,我们基于自己搭建的自然驾驶行为分析,主要在高速公路面采集数据,对数据进行分析、提取,提取驾驶员个性化特征,有哪些参数表现驾驶员个性特征,提取这些参数,对决策控制模型进行训练和标定。

    

因为我们是高速公路场景,所以主要的工况只有两种,一种是跟车,一种是换道。我们把换道场景提取出来,对它进行持续类分三个阶段,对每个阶段进行总结描述,我们基于这些统计学方法获取哪些参数更能够表征驾驶员个性化特征,从高到低进行排序,来训练和标定后面的模型。

    

我们采用人工势场方法,这个方法主要问题是它的参数很难标定,以往采用试出方法,我们现在做的工作是用我们前面的自动驾驶数据分析结果,体现个性化驾驶映射到人工算法里,建立基于人工算法的局部规划模型。

    

我们对人工智能进行了小的改变它在路边车道时会在路边车道产生局部最小值,为了解决这个问题我们变成T型势场,我们利用前面的自然驾驶数据分析的结果,因为它影响了从高到低排了序,首先纵向势场,我们选取排名最靠前的两个参数,来标定人工势场中对应的参数进而形成纵向的个性化的人工势场。

    

这是效果图,左边、右边分别是有两个驾驶员的实验参数标定的模型,红点是稳定跟车的距离,可见左边稳定跟车距离明显比右边的稳定跟车距离要远。

    

然后横向势场,我们选用了对个性化影响最显著的横摆角参数,进行标定。这个效果图可见左边驾驶员A训练标定之后的势场,它的换道时间和换道距离更长,它的换道相对温和。我们把所有势场叠加形成了局部路径,局部路径情景之后,我们要对局部路径进行跟踪控制,我们设置典型场景的控制。众所周知传统的MPC算法它最大问题是它的控制精度取决于模型的精确性,车辆动力学是非常复杂的过程,我们很难用数学方法进行描述,它的模型偏差是比较大的。虽然它有局部的反馈调解,但它的效果并不好,毕竟比例反馈容易使系统产生震荡。同时我们又加了PID通道,把稳定偏差作为PID,反向调解PID的控制。

    

如果没有反馈调解,它在过90弯度时,最多可以达到半米的稳态误差。

    

我们的MPC控制器纵向输出的是加速度和速度,所以我们还需要速度跟踪器,我们这里面期望变成底层控制参数。

    

这是我们进行的仿真结果,红色车辆是代表我们的被控车,蓝色的是环境车,它要过90度弯,右边是它过90度弯时能精确的跟踪参考轨迹,而且离道路中心线距离比较近,它的跟踪效果是比较好的。

    

对比传统MPC,过90度弯时有比较大的稳态误差,它会慢慢向中心线右边偏移,累计下来它的误差会变得很大。

    

同样我们要把我们的个性化的特征映射到控制器里,这里主要是对MPC约束进行了个性化的调整,我们用前面专家结论,主要是约束的纵向加速度和横摆角速度,我们用前面的数据统计的结果算出了我们纵向加速度和横摆角加速度自行区间,我们将自行区间作为两个参数的约束,将约束放在算法里进行优化求解。

    

面向实时控制的快速MPC算法,我们可以解出最优值再将最优值和对应空间存储起来,我们在车辆控制时直接调用就可以了,提升速度节省资源。

    

我们对比了自动驾驶里面普遍采用的Stanley控制算法,左边是运行时间,右边运行效果。我们不光是控制效果好,而且实效性基本接近Stanley控制效果。

    

因为不同的场景,因为MPC的参数确定之后,它不同场景可能效果好坏不一样,我们就针对不同场景设置了多个控制器,不同场景进行切换,待切换的MPC在场景过渡时,右边可以看到仿真结果在切换时它可能稳定性更加好一些,能够更加自由的过渡。

    

我们单车个性化汇报到这里,下面是考虑个性化多车协同的决策控制。

    

多车协同我们提出驾驶行为相容性的指标,考虑前面专家结果,我们通过数学统计方法算出了相容性指标,这个相容性指标通过公司推断,我们算出它大于5.1时两个驾驶员操作参数比较相似,而且我们对比了自然驾驶的数据,发现当指标比较大的时候,两侧趋近于左侧行驶,接近时,是换道超车的动作。

    

协同在高速公路上就只有一个换道超车这一种协同方式,我们想研究个性化驾驶在高速公路场景下它的协同方式到底怎么样,我们同样基于我们前面的实验数据,通过视频采集到在高速公路上偏激进的驾驶员,可能在协同或者换道超车时,它趋向于左转,偏保守驾驶员趋向于,我们要将这个协同策略融合到我们MPC算法里,我们采用了布尔运算的方式,利用这些辅助函数,用布尔运算将我们前面提到的激进型的驾驶员偏向走快车道加速,就可以达到一个我们人类比较适应的协同方式。

    

针对以上我们的单车和多车个性化驾驶的算法,我们做了一系列的实验。单车个性化驾驶做了三个场景:保持车道、减速跟车、单次变道。我们AB两个控制器,前面是两个驾驶员训练数据标定出来的,B明显在平均速度方面比A明显大一些,我们A控制器和前面数据分析的结果也是吻合的,我们左侧变道时同样可见A驾驶员的换道时间和换道加速度都更大一些,所以说我们A驾驶员更温和一点。我们在实车上实现了我们的算法。

    

我们在实车上主要测两个场景:减速跟车、左侧换道。减速跟车是A标定出来的驾驶员加减速更加温和,平均速度更低,他在左侧换道过程中,他的横摆角速度更小一点,换道时间更长一些。

    

我们是个性化多车协同的验证,我们测试了三个场景:

    

首先是环境车不可控,第一个场景只有被控车辆是可控的,环境车基于实际速率涉及两个不可控的环境车,这环境车是自主的。不考虑个性化的话,传统场景是换道超车再回到原车道并线,但是由于正前方环境车,我们给它的是一个比较激进的策略,所以说你在想要换道时它会加速,所以在我们仿真中如果被控车在这时换道,前车加速和环境车并行,我们就会采用换道失败的效果。

    

如果我们了解到正前方的车辆是比较激进的驾驶员,我们一开始就不换道只是跟车,环境车自然会加速,两车并行行驶。右边两个车辆是偏保守驾驶员,左边车辆是驾驶风格激进的驾驶员,我们仿真的结果是右边两个驾驶员风格相似偏保守的驾驶员会让行红色车辆,红色车辆换道超车,他们的速度、加速度和前面单车也差不多。五车协同的话,右边三个绿色车辆是偏保守的车辆,两边是驾驶风格偏激进车辆,测试结果也一样。右边车辆发现后面有激进车辆要超车时,它就会换道让行,三个绿色车辆组成一个队,两个红色车辆组成一队,绿色车辆让行,红色车辆超车。

    

总结我们做的工作,基于混成自动机建立了自动驾驶系统架构,基于这个架构我们在里面实现了个性化的决策规划与控制,我们提出基于改进人工势场算法的个性化轨迹规划方法。我们设计了多种典型场景的轨迹跟踪控制器,我们将场景、驾驶个性和实时性都考虑进去,对这个MPC控制器进行比较大的改进,我们研究了考虑驾驶员个性的多车协同决策控制方法,使其能够在一定区域内对多个车辆进行个性化的控制。

    

展望:我们现有的数据都是高速公路的数据,我们后面可能会开展复杂城市道路环境下个性化驾驶的研究。前面徐昕老师讲的,我们以后也会结合机器学习方法充分挖掘自然驾驶数据多维性。因为我们现在基于规则来做这个事情,其实我们数据的很多维度没有用到,所以我们以后打算结合机器学习算法充分挖掘自动驾驶数据的结论,建立更为个性化的驾驶员模型。

    

谢谢!

x

收藏 0
打赏
相关标签:
电话:010-65030507
邮箱:editor@autor.com.cn
地址:北京市朝阳区朝外大街乙6号朝外SOHO D座5097室
北京智驾时代传媒科技有限公司          Copyright © 2014 - 2022
Autor.com.cn All Rights Reserved. 版权所有 AutoR智驾 智能汽车网
京ICP备14027737号-1      京公网安备 11010502038466号
电信与信息服务业务经营许可证:京B-20211307
关注官方微信