数据-模型双重驱动的智能车辆轨迹跟踪控制系统及方法

2025-08-13 14:40:02 572次浏览

本技术涉及智能交通，尤其涉及一种数据-模型双重驱动的智能车辆轨迹跟踪控制方法。

背景技术：

1、轨迹跟踪技术是智能驾驶车辆实现智能化的重要环节之一，它是指通过根据某种控制理论，为车辆的控制系统设计一个控制输入作用，使得智能驾驶车辆能够以期望的速度跟踪目标轨迹。通常对于轨迹的跟踪即通过对车辆的纵向与横向实施控制使其跟上期望轨迹，这对智能车辆实现智能化自动化有着重要的意义。目前的研究中一般采用纯跟踪算法、线性二次型调节器、滑膜控制、pid控制、模型预测控制等传统控制方法。

2、纯跟踪算法、线性二次型调节器等常规控制方法均能通过选择前方目标点并计算所需转向角来解决常速良好路面工况下的轨迹跟踪控制。这些控制方法对于复杂非线性系统来说往往存在着较大误差和振荡现象。滑模控制(smc)是一种鲁棒的控制策略，通过定义滑模面和设计控制律，使系统状态沿滑模面滑动，实现对车辆轨迹的跟踪，该方法可能导致高频抖动(抖振)、设计过程复杂以及在动态特性变化较大时控制精度可能受到限制。pid控制器是一种经典的反馈控制器，用于调节系统的输出，使其接近预期的参考值或轨迹。在车辆轨迹跟踪控制中，pid控制器通常用来调节车辆的转向角(方向盘角度)，使车辆沿着预定的轨迹行驶。然而，pid控制器在车辆轨迹跟踪控制中虽然简单有效，但存在显著缺点：适应非线性系统差、难以处理时变系统、预测能力有限以及不适合复杂轨迹或多变环境。模型预测控制(mpc)在轨迹跟踪控制研究中是指在一个有限的预测时间范围内优化所选取的性能指标，获得当前时刻的最优控制指令，并通过滚动优化的方式，将车辆跟踪时在下一时刻的跟踪误差达到最小值。然而，该方法因为控制时域固定，无法根据实际情况调整，在优化过程中对车辆横摆角和目标轨迹的跟踪误差较大，无法满足现阶段智能车辆对于从初始车道到目标车道轨迹跟踪的需求。

技术实现思路

1、本技术提供了一种数据-模型双重驱动的智能车辆轨迹跟踪控制系统及方法，其技术目的是解决传统mpc方法在优化过程中，控制时域固定，无法根据实际情况精确调整车辆的横摆角和跟踪轨迹，导致其误差较大，无法满足现阶段智能车辆对于复杂时变目标轨迹的跟踪效果问题。

2、本技术的上述技术目的是通过以下技术方案得以实现的：

3、一种数据-模型双重驱动的智能车辆轨迹跟踪控制系统，包括车辆动力学模块、参考轨迹模块、基于强化学习的预测模块、反馈校正模块和滚动优化模块。

4、基于车辆四自由度模型和经典魔术轮胎公式建立车辆动力学模块，车辆动力学模块用于获取主车状态信息和车辆位置信息；

5、参考轨迹模块根据车辆动力学模块获取的主车状态信息和车辆位置信息，采用轨迹生成函数，生成目标路径；

6、强化学习预测模块用于获取控制路径，建立智能体神经网络，设置路径优化的奖励函数r(t)，奖励函数r(t)和车辆外部信息作为智能体神经网络的输入，智能体神经网络输出预测状态信息给路径控制决策函数，得到最优控制路径；

7、反馈校正模块根据车辆实时状态和强化学习预测模块获取的控制路径计算路径反馈校正调整量；

8、滚动优化模块基于目标路径、控制路径、路径反馈校正调整量和主车状态信息，采用滚动优化函数得到当前时刻的最优控制路径，作用于控制对象；

9、将当前时刻的最优控制路径作为下一时刻的强化学习预测模块的奖励函数，并将当前时刻的车辆状态信息反馈给轨迹生成函数，实现对车辆轨迹跟踪的实时控制。

10、进一步的，车辆动力学模块具体为：

11、

12、式中m为汽车质量，vx、vy为车辆纵向速度和横向速度，δf为前轮转角，为横摆角，αf、αr为前后轮侧偏角，lf、lr为前后轴距，cf、cr为前后轮侧偏刚度，iz为转动惯量，tf为前轴宽度，tr为后轴宽度，fxfl、fxfr、fxrl、fxrr分别是车辆的前左、前右、后左、后右轮胎纵向力，fyfl、fyfr、fyrl、fyrr分别是车辆的前左、前右、后左、后右轮胎侧向力。

13、进一步的，参考轨迹模块采用如下轨迹生成函数生成目标路径：

14、yr(k+j)＝αys(k)+(1-α)y(k)

15、式中，y(k)为系统在时间步k上期望的输出值，k、j为系统时间步，α为误差的加权因子。

16、进一步的，强化学习预测模块的智能体神经网络包括输入层、全连接层和输出层；

17、输入层输入的车辆外部信息包括速度、加速度、车辆所受载荷。

18、进一步的，强化学习预测模块中根据奖励函数r(t)、环境状态变量s(t)和强化信息p得到路径控制决策函数θk+j：

19、

20、其中，t为历史数据个数；st为环境状态变量；at为控制决策；函数表示在当前状态和操作下的优势；函数g(*)表示幅度限制函数；表示当前状态决策与新状态决策的概率比值。

21、进一步的，强化学习预测模块的奖励函数r(t)如下：

22、

23、式中，x1表示超调量；xe1表示期望超调量；λ1表示超调量的调整值；x2表示收敛时间；xe2表示期望收敛时间；λ2表示收敛时间的调整值；

24、环境状态变量s(t)为：

25、vπ[s(t)]＝r{π[s(t)]}+γ∑p[s(t),a(t),s(t+1)]vπ[s(t+1)]

26、vπ(s)表示状态价值函数；π(s)表示智能体的策略；γ表示回报值；a(t)表示控制决策；p表示强化信息；

27、强化信息p为：

28、p[s＝s(t+1)/s(t)]＝p[s(t),a(t),s(t+1)]。

29、进一步的，反馈校正模块采用下式计算路径反馈校正调整量：

30、ym1(k+j)＝ym(k+j)+θk+j×[y(k)-ym(k)]

31、式中，ym(k+j)表示反馈校正量；θk+j×(y(k)-ym(k))表示为反馈校正调整量。

32、进一步的，滚动优化模块采用的滚动优化函数具体为：

33、

34、式中，uk表示时间步k的控制输入；p表示扰动变量；表示状态矩阵；bi表示输入矩阵。

35、本技术的有益效果在于：本技术所述的数据-模型双重驱动的智能车辆轨迹跟踪控制系统及方法，首先基于车辆四自由度模型和经典魔术轮胎公式建立车辆动力学模块为后续的跟踪控制模块提供基础；其次设计参考轨迹模块，根据主车状态信息生成目标路径；接下来设计强化学习预测模块，得到最优的控制路径；然后设计反馈校正模块，用于保证预测模型的准确性，使预测值与实际值相接近；最后设计滚动优化模块，采用滚动优化函数得到当前时刻的最优控制路径，作用于控制对象。本技术所述轨迹跟踪控制方法降低了智能车辆在运行时横向位移、轨迹跟踪误差、横摆角和期望横摆角的控制难度，实现自车从初始车道到目标车道的安全、平稳切换，保证智能驾驶汽车在时变交通环境下的安全行驶。

文档序号 : 【 40124493 】

技术研发人员：严永俊,张鹏,皮大伟,都超,尹澳,王洪亮,王显会
技术所有人：南京理工大学

备注：该技术已申请专利，仅供学习研究，如用于商业用途，请联系技术所有人。
声明 ：此信息收集于网络，如果你是此专利的发明人不想本网站收录此信息请联系我们，我们会在第一时间删除

严永俊丨张鹏丨皮大伟丨都超丨尹澳丨王洪亮丨王显会丨南京理工大学

一种适用于大型U型槽式三段直线电机的辅助折叠装置的制作方法一种站点无人机充换电方法、系统、无人机及存储介质与流程