面向队列系统的车联网频谱资源共享方法
技术特征:
1.一种面向队列系统的车联网频谱资源共享方法,其特征在于,包括:
2.根据权利要求1所述的一种面向队列系统的车联网频谱资源共享方法,其特征在于,利用深度强化学习算法训练车辆队列系统模型的强化学习方法为:
3.根据权利要求2所述的一种面向队列系统的车联网频谱资源共享方法,其特征在于,还包括通过建立马尔可夫决策过程(markov decision process,mdp),mdp主要由状态空间(state space,s)、动作空间(action space,a)和奖励函数(reward function,r)组成;
4.根据权利要求3所述的一种面向队列系统的车联网频谱资源共享方法,其特征在于,所述状态空间为:智能体n的所观察到的局部信息状态有自己的信道增益gn[i],v2v链路n'对v2v链路n的干扰信道功率增益gn`,n[i],在i号子带上v2v链路n对v2i链路m的干扰信道增益gn,m[i],v2i链路m到基站在第i个子带上传输的信道增益gm,b[i],以及来自其他所有链路的干扰噪声功率in[i];
5.根据权利要求3所述的一种面向队列系统的车联网频谱资源共享方法,其特征在于,所述动作空间为:
6.根据权利要求3所述的一种面向队列系统的车联网频谱资源共享方法,其特征在于,所述奖励函数为:
7.根据权利要求3所述的一种面向队列系统的车联网频谱资源共享方法,其特征在于,还包括通过基于近端策略优化(proximal policy optimization,ppo)的多智能体强化学习算法采取集中式训练,分布式执行的框架对总优化目标函数进行强化学习,具体包括:
8.根据权利要求7所述的一种面向队列系统的车联网频谱资源共享方法,其特征在于,所述多智能体强化学习算法采取集中式训练算法流程步骤为:
技术总结
本发明公开了一种面向队列系统的车联网频谱资源共享方法,属于车联网频谱共享技术领域,包括通过利用深度强化学习算法训练车辆队列系统模型根据实时的网络状态得到的频谱分配决策;以分配频谱资源使车辆对基础设施链路的总传输速率,并确保车辆对车辆链路的有效载荷在期望的延迟限制下达到优化的传递成功率。本发明中,通过设计的面向队列系统的车联网频谱资源共享方法能够优化链路性能,并且通过智能化的资源分配设计管理车联网对联之间的干扰,每个智能体能够进行不同的功率选择来共享频谱资源以最大限度地提高链路的总传输速率和链路有效载荷的传输成功率,提高面向队列系统的共享稳定。
技术研发人员:孙宇宁,胡曦
受保护的技术使用者:东北大学秦皇岛分校
技术研发日:
技术公布日:2024/11/26
文档序号 :
【 40126428 】
技术研发人员:孙宇宁,胡曦
技术所有人:东北大学秦皇岛分校
备 注:该技术已申请专利,仅供学习研究,如用于商业用途,请联系技术所有人。
声 明 :此信息收集于网络,如果你是此专利的发明人不想本网站收录此信息请联系我们,我们会在第一时间删除
技术研发人员:孙宇宁,胡曦
技术所有人:东北大学秦皇岛分校
备 注:该技术已申请专利,仅供学习研究,如用于商业用途,请联系技术所有人。
声 明 :此信息收集于网络,如果你是此专利的发明人不想本网站收录此信息请联系我们,我们会在第一时间删除
