一种自动驾驶多智能体未来行为拓扑推理方法、装置、设备、介质及产品与流程

2025-09-06 09:40:07 367次浏览

本发明实施例涉及自动驾驶，尤其涉及一种自动驾驶多智能体未来行为拓扑推理方法、装置、设备、介质及产品。

背景技术：

1、自动驾驶系统旨在通过交互式智能体(agents)之间的行为整合实现安全且符合社会行为规范(合规)的驾驶。然而，多智能体(multi-agents)驾驶场景的不确定性和异构交互仍是当前面临的最大挑战。为了建立更为兼容的多智能体未来行为表征，当前的主流范式分为两种，即密集表示和稀疏表示。但是，当前密集和稀疏的未来行为表示在多智能体建模中，存在效率低下和不一致的问题，导致在ipp(integrated prediction andplanning，联合预测和规划)时多智能体行为模式不稳定。

技术实现思路

1、本发明实施例提供一种自动驾驶多智能体未来行为拓扑推理方法、装置、设备、介质及产品，以实现能够增强联合预测和规划多智能体行为的一致性和准确性。

2、根据本发明的一方面，提供了一种自动驾驶多智能体未来行为拓扑推理方法，包括：

3、获取当前车辆的位置信息和所述当前车辆所在场景中包括的智能体集合中每个智能体的位置信息；

4、将所述当前车辆的位置信息和每个智能体的位置信息输入协同学习模型，得到未来行为拓扑推理结果，其中，所述协同学习模型通过训练样本集迭代训练初始模型得到，所述训练样本集包括：智能体集合样本和所述智能体集合样本对应的未来行为拓扑推理结果样本。

5、根据本发明的另一方面，提供了一种自动驾驶多智能体未来行为拓扑推理装置，该装置包括：

6、获取模块，用于获取当前车辆的位置信息和所述当前车辆所在场景中包括的智能体集合中每个智能体的位置信息；

7、输入模块，用于将所述当前车辆的位置信息和每个智能体的位置信息输入协同学习模型，得到未来行为拓扑推理结果，其中，所述协同学习模型通过训练样本集迭代训练初始模型得到，所述训练样本集包括：智能体集合样本和所述智能体集合样本对应的未来行为拓扑推理结果样本。

8、根据本发明的另一方面，提供了一种电子设备，所述电子设备包括：

9、至少一个处理器；以及

10、与所述至少一个处理器通信连接的存储器；其中，

11、所述存储器存储有可被所述至少一个处理器执行的计算机程序，所述计算机程序被所述至少一个处理器执行，以使所述至少一个处理器能够执行本发明任一实施例所述的自动驾驶多智能体未来行为拓扑推理方法。

12、根据本发明的另一方面，提供了一种计算机可读存储介质，所述计算机可读存储介质存储有计算机指令，所述计算机指令用于使处理器执行时实现本发明任一实施例所述的自动驾驶多智能体未来行为拓扑推理方法。

13、根据本发明的另一方面，本发明实施例还提供了一种计算机程序产品，计算机程序产品包括计算机程序，计算机程序在被处理器执行时实现本发明任一实施例所述的自动驾驶多智能体未来行为拓扑推理方法。

14、本发明实施例通过获取智能体集合样本和智能体集合样本对应的未来行为拓扑推理结果样本组成训练样本集，迭代训练初始模型，得到协同学习模型，获取当前车辆的位置信息和当前车辆所在场景中包括的智能体集合中每个智能体的位置信息，将当前车辆的位置信息和每个智能体的位置信息输入协同学习模型，得到未来行为拓扑推理结果。通过本发明的技术方案，能够增强联合预测和规划多智能体行为的一致性和准确性。

15、应当理解，本部分所描述的内容并非旨在标识本发明的实施例的关键或重要特征，也不用于限制本发明的范围。本发明的其它特征将通过以下的说明书而变得容易理解。

技术特征：

1.一种自动驾驶多智能体未来行为拓扑推理方法，其特征在于，包括：

2.根据权利要求1所述的方法，其特征在于，通过训练样本集迭代训练初始模型，包括：

3.根据权利要求2所述的方法，其特征在于，将所述训练样本集中的智能体集合样本输入所述初始模型得到所述智能体集合样本对应的预测未来行为拓扑推理结果，包括：

4.根据权利要求3所述的方法，其特征在于，根据每个智能体样本的位置信息构建拓扑图，包括：

5.根据权利要求2所述的方法，其特征在于，还包括：

6.根据权利要求3所述的方法，其特征在于，将所述拓扑图输入所述初始模型中的编解码器，得到所述智能体集合样本对应的预测未来行为拓扑推理结果，包括：

7.一种自动驾驶多智能体未来行为拓扑推理装置，其特征在于，包括：

8.一种电子设备，其特征在于，所述电子设备包括：

9.一种计算机可读存储介质，其特征在于，所述计算机可读存储介质存储有计算机指令，所述计算机指令用于使处理器执行时实现权利要求1-6中任一项所述的自动驾驶多智能体未来行为拓扑推理方法。

10.一种计算机程序产品，包括计算机程序，所述计算机程序在被处理器执行时实现根据权利要求1-6中任一项所述的自动驾驶多智能体未来行为拓扑推理方法。

技术总结
本发明公开了一种自动驾驶多智能体未来行为拓扑推理方法、装置、设备、介质及产品。该方法包括：获取当前车辆的位置信息和所述当前车辆所在场景中包括的智能体集合中每个智能体的位置信息；将所述当前车辆的位置信息和每个智能体的位置信息输入协同学习模型，得到未来行为拓扑推理结果，其中，所述协同学习模型通过训练样本集迭代训练初始模型得到，所述训练样本集包括：智能体集合样本和所述智能体集合样本对应的未来行为拓扑推理结果样本。通过本发明的技术方案，能够增强联合预测和规划多智能体行为的一致性和准确性。

技术研发人员：李弘扬,刘浩晨,吕辰,陈立,乔宇
受保护的技术使用者：上海人工智能创新中心
技术研发日：
技术公布日：2024/11/18

文档序号 : 【 40048473 】

技术研发人员：李弘扬,刘浩晨,吕辰,陈立,乔宇
技术所有人：上海人工智能创新中心

备注：该技术已申请专利，仅供学习研究，如用于商业用途，请联系技术所有人。
声明 ：此信息收集于网络，如果你是此专利的发明人不想本网站收录此信息请联系我们，我们会在第一时间删除

李弘扬丨刘浩晨丨吕辰丨陈立丨乔宇丨上海人工智能创新中心