云计算环境下基于强化学习的虚拟机资源调度
发布时间:2025-07-03 03:29
针对云计算环境下多用户多资源虚拟机调度的延迟问题,为了优化虚拟机的任务完成时间,提出一种基于强化学习的虚拟机资源调度方法。首先以虚拟机的任务完成时间为优化目标建立基于延迟的虚拟机资源调度模型,然后通过定义虚拟机配置数组来将多资源多类的虚拟机资源调度问题转化为单维的虚拟机调度决策问题,接着提出面向延迟的虚拟机资源调度强化学习算法,将任务完成时间作为奖赏函数,通过贪婪行为策略选择最优的调度策略来达到最大奖励,从而获得最优的平均任务完成时间。仿真结果表明,与现有算法相比,该方法在提高虚拟机资源利用率与减少任务的延迟方面性能显著。
【文章页数】:6 页
【部分图文】:
本文编号:4055698
【文章页数】:6 页
【部分图文】:
图1 基于强化学习的虚拟机调度方法
设计了一种基于强化学习的虚拟机资源调度方法,如图1所示。(1)每当有虚拟机任务到达时,按虚拟机任务的资源需求将其放入系统对应的缓存队列,例如,第v类虚拟机任务进入第v个虚拟机队列;(2)在每个调度时隙的开始时刻,调度系统感知云计算环境的状态,包括当前正在调度的任务,队列长度等,将....
图2 任务完成时间vs虚拟机到达速率
根据googletrace[16]报告的云计算环境虚拟机任务特性,用Matlab产生随机序列来模拟虚拟机任务请求到达特性。设3类虚拟机请求的平均时长均为4个时隙,设到Type-2和Type-3的到达速率分别为λ2=0.025任务/时隙,λ3=0.015任务/时隙,则系统的平均任....
图3 任务完成时间vs所有虚拟机到达速率
当所有类型虚拟机的到达速率都比较大时,所提的基于延迟的强化学习算法性能优势更加显著,如图3所示。由图3可见,随着所有类型的虚拟机到达速率的上升,Myopic-MaxWeight算法的平均任务完成时间快速上升,例如,当每类虚拟机任务的到达速率为0.125请求/时隙时,平均任务完成时....
图4 任务完成时间vs虚拟机任务时长
设3类虚拟机任务的到达速率分别为λ1=0.025任务/时隙,λ2=0.025任务/时隙,λ3=0.015任务/时隙。设Type-1和Type-2虚拟机请求的平均时长为4个时隙,则系统的平均任务完成时间随着Type-3虚拟机任务时长的变化如图4所示。由图4可见,平均任务完成时间随着....
本文编号:4055698
本文链接:https://www.wllwen.com/kejilunwen/jisuanjikexuelunwen/4055698.html