当前位置:主页 > 科技论文 > 航空航天论文 >

基于分支深度强化学习的非合作目标追逃博弈策略求解

发布时间:2025-05-15 03:48
   为解决航天器与非合作目标的空间交会问题,缓解深度强化学习在连续空间的应用限制,提出了一种基于分支深度强化学习的追逃博弈算法,以获得与非合作目标的空间交会策略。对于非合作目标的空间交会最优控制,运用微分对策描述为连续推力作用下的追逃博弈问题;为避免传统深度强化学习应对连续空间存在维数灾难问题,通过构建模糊推理模型来表征连续空间,提出了一种具有多组并行神经网络和共享决策模块的分支深度强化学习架构。实现了最优控制与博弈论的结合,有效解决了微分对策模型高度非线性且难于利用经典最优控制理论进行求解的难题,进一步提升了深度强化学习对离散行为的学习能力,并通过算例仿真检验了该算法的有效性。

【文章页数】:11 页

【文章目录】:
1 航天器与非合作目标的动力学模型
2 空间行为的模糊推理模型
3 追逃博弈的分支深度强化学习
    3.1 多组并行的网络分支
    3.2 共享行为决策模块
    3.3 航天器与非合作目标的博弈交互
4 算例分析
5 结论



本文编号:4046198

资料下载
论文发表

本文链接:https://www.wllwen.com/kejilunwen/hangkongsky/4046198.html


Copyright(c)文论论文网All Rights Reserved | 网站地图 |

版权申明:资料由用户23eed***提供,本站仅收录摘要或目录,作者需要删除请E-mail邮箱bigeng88@qq.com