基于分支深度强化学习的非合作目标追逃博弈策略求解

发布时间：2025-05-15 03:48

　　为解决航天器与非合作目标的空间交会问题,缓解深度强化学习在连续空间的应用限制,提出了一种基于分支深度强化学习的追逃博弈算法,以获得与非合作目标的空间交会策略。对于非合作目标的空间交会最优控制,运用微分对策描述为连续推力作用下的追逃博弈问题;为避免传统深度强化学习应对连续空间存在维数灾难问题,通过构建模糊推理模型来表征连续空间,提出了一种具有多组并行神经网络和共享决策模块的分支深度强化学习架构。实现了最优控制与博弈论的结合,有效解决了微分对策模型高度非线性且难于利用经典最优控制理论进行求解的难题,进一步提升了深度强化学习对离散行为的学习能力,并通过算例仿真检验了该算法的有效性。

【文章页数】：11 页

【文章目录】：
1 航天器与非合作目标的动力学模型
2 空间行为的模糊推理模型
3 追逃博弈的分支深度强化学习
    3.1 多组并行的网络分支
    3.2 共享行为决策模块
    3.3 航天器与非合作目标的博弈交互
4 算例分析
5 结论

本文编号：4046198

资料下载

论文发表

支付宝下载

Download by Alipay
微信下载

Download by Wechat
会员下载

Download by Member

本文链接：https://www.wllwen.com/kejilunwen/hangkongsky/4046198.html

上一篇：火箭上升段带终端姿态约束的闭环制导方法工程应用研究
下一篇：卷积神经网络在低空空域无人机检测中的研究

论文发表

·知网|万方|维普|龙源|省级|国家级|科技核心|北大核心|南大核心CSSCI|EI|SCI|SSCI|