基于多智能体深度强化学习的移动边缘计算任务卸载方法
技术特征:
1.一种基于多智能体深度强化学习的移动边缘计算任务卸载方法,其特征在于,包括:
2.根据权利要求1所述的基于多智能体深度强化学习的移动边缘计算任务卸载方法,其特征在于,在步骤s1中,基站表示为bsi(i∈1,2,…m),边缘服务器为esi,用户设备为muj(j∈1,2,…n),所述基站与边缘服务器之间通过物理链路连接,用户设备与基站之间通过无线链路连接,边缘服务器为用户设备提供计算服务;
3.根据权利要求2所述的基于多智能体深度强化学习的移动边缘计算任务卸载方法,其特征在于,在步骤s2中,使用变量ωj来表示用户设备muj的卸载决策,若ωj=0表示用户选择任务在本地执行,若ωj=1表示用户选择卸载任务到边缘服务器执行,若ωj=-1表示用户选择卸载任务到云服务器执行。
4.根据权利要求3所述的基于多智能体深度强化学习的移动边缘计算任务卸载方法,其特征在于,用户选择在本地执行任务时,具体为:任务lj在用户本地执行,计算成本仅由执行时延和执行能耗构成,执行时延表示为:其中为用户设备muj的cpu频率,cpu频率以每秒周期数为单位,η为执行一比特任务所需的cpu周期数;执行能耗表示为:其中κ表示每个cpu周期的有效电容系数;因此,本地计算成本开销为:其中α∈[0,1]为时延成本与能耗成本的权重系数。
5.根据权利要求4所述的基于多智能体深度强化学习的移动边缘计算任务卸载方法,其特征在于,用户将任务卸载到边缘服务器或云服务器执行时,具体为:根据香农定理,用户设备muj到边缘服务器esi可达到的传输速率为:用户设备muj到云服务器cloud可达到的传输速率为:其中σ2是加性高斯白噪声功率,w是带宽,poff是卸载功率,用户设备muj到边缘服务器esi的信道系数为hj,i,到云服务器的信道系数为hj,cloud;
6.根据权利要求5所述的基于多智能体深度强化学习的移动边缘计算任务卸载方法,其特征在于,步骤s3中所构建的优化函数,具体为:
7.根据权利要求3所述的基于多智能体深度强化学习的移动边缘计算任务卸载方法,其特征在于,所述智能体的状态空间、动作空间以及奖励函数,具体定义为:
8.根据权利要求7所述的基于多智能体深度强化学习的移动边缘计算任务卸载方法,其特征在于,所述的基于多智能体深度确定性策略梯度算法和自注意力机制的模型设有经验回放缓冲区,模型中每个智能体的网络结构包括:1个当前actor网络μ、1个目标actor网络μ′、1个当前critic网络q、1个目标critic网络q′,定义智能体j的4个网络参数分别为
9.根据权利要求8所述的基于多智能体深度强化学习的移动边缘计算任务卸载方法,其特征在于,所述智能体的网络进行参数更新,具体包括:
技术总结
本发明公开的基于多智能体深度强化学习的移动边缘计算任务卸载方法,设计了配备MEC服务器的云‑边‑端网络架构的MEC系统以及融入了自注意力机制的多智能体深度确定性策略梯度算法,优化多用户在MEC系统下的任务计算卸载,使智能体将注意力集中在对当前任务具有关键性的状态信息上,从而提高决策的准确性,同时采用云服务器、边缘服务器和本地设备相结合的方式提供任务执行服务,能提高任务执行的灵活性和效率,最小化整个系统的平均用户成本;此外,提出的任务卸载方法允许用户在本地自行做出任务的最优卸载决策,不必再将任务传输至中央服务器进行决策,减少了传输的计算成本,提高卸载效率。
技术研发人员:谢满德,李龙辰
受保护的技术使用者:浙江工商大学
技术研发日:
技术公布日:2024/12/2
技术研发人员:谢满德,李龙辰
技术所有人:浙江工商大学
备 注:该技术已申请专利,仅供学习研究,如用于商业用途,请联系技术所有人。
声 明 :此信息收集于网络,如果你是此专利的发明人不想本网站收录此信息请联系我们,我们会在第一时间删除
