基于深度强化学习的旋翼无人机端到端伺服控制研究

发布时间：2021-08-01 16:28

　　无人机集群在军民领域中具有巨大的应用前景,吸引了越来越多的研究人员对其关键技术进行攻关。集群中无人机数量众多,在诸如无人机群自主续航、自主回收等场合,无人机自主降落是集群高效管理的核心技术之一。本课题针对无人机自主降落问题,采用深度强化学习实现鲁棒的无人机自主降落,即在深度强化学习的框架下,以图像作为模型的输入,设计端到端的无人机自主降落伺服控制方法,以提高无人机自主降落的智能化水平。课题的主要研究内容如下:（1）在深度强化学习框架下,设计并实现用于解决无人机自主降落问题的值函数Q-learning学习算法。首先将无人机的降落问题描述为马尔科夫决策过程,将无人机下视图像直接作为无人机状态,离散化动作作为无人机行为,并利用无人机位置信息构建奖励回报函数。借助无人机与环境的交互迭代,完成深度强化学习神经网络的训练,实现无人机自主降落的端到端控制。训练过程包括原始Q-learning算法,3DQN（Dueling-Double-Deep Q-learning Network）算法等。为提高训练速度,加速模型收敛,算法进一步引入外部控制器、使用数据库预训练等方式。仿真验证表明,提出的端对端控制...

【文章来源】：国防科技大学湖南省 211工程院校 985工程院校

【文章页数】：117 页

【学位级别】：硕士

【部分图文】：

无人机

示意图,无人机,平台

示意图,无人机

国防科技大学研究生院硕士学位论文第4页图1.2系留无人机平台(a)AtlasNEST智能无人机场及AtlasPro机场专用无人机(b)Airobotics公司用于续航的机场平台图1.3两种无人机续航管理平台产品示意图无人机集群的回收，是无人机系统在实际应用过程中需要考虑的重点问题，因为无人机的损毁事故80%发生在起降阶段[4]。一般有有遥控降落回收、伞降、空中捕获、跑道滑跑着陆、拦阻网或“天钩”回收、垂直着陆等方法。图1.4是四种经典的回收方式。其中遥控降落回收、跑道滑跑着陆的最后阶段，还需要飞手接管、遥控操作，对于飞机数量众多的无人机集群来说，势必会占用大量人力、物力。伞降、撞网、或者挂索回收过程复杂，操作控制难度大，容易造成无人机损坏。其中垂直降落回收只需要小面积回收场地，不受回收区地形条件的限制。

【参考文献】：
期刊论文
[1]深度学习优缺点的剖析[J]. 孙晖.  电子制作. 2018(18)
[2]深度强化学习研究综述[J]. 赵星宇,丁世飞.  计算机科学. 2018(07)
[3]未来触手可及——AlphaZero学棋记[J]. 陈轶翔.  世界科学. 2018(02)
[4]深度强化学习进展:从AlphaGo到AlphaGo Zero[J]. 唐振韬,邵坤,赵冬斌,朱圆恒.  控制理论与应用. 2017(12)
[5]从监督学习到强化学习,四种深度学习方式原理知多少[J]. 房晓楠.  机器人产业. 2017(04)
[6]深度学习研究与进展[J]. 孙志远,鲁成祥,史忠植,马刚.  计算机科学. 2016(02)
[7]基于Q学习的无人机三维航迹规划算法[J]. 郝钏钏,方舟,李平.  上海交通大学学报. 2012(12)
[8]基于Q学习的变体无人机控制系统设计[J]. 徐小野,李爱军,张丛丛,姚宗信.  西北工业大学学报. 2012(03)
[9]一种基于强化学习的UAV目标搜索算法[J]. 张晶晶,周德云,张堃.  计算机应用研究. 2011(10)
[10]机器学习的主要策略综述[J]. 闫友彪,陈元琰.  计算机应用研究. 2004(07)

硕士论文
[1]多旋翼无人机视觉引导降落研究[D]. 樊珑.哈尔滨工业大学 2016
[2]基于视觉引导的无人直升机自主着舰技术研究[D]. 陈银军.南昌航空大学 2015
[3]基于红外探测器的无人机地基视觉引导着陆关键技术研究[D]. 张宇.国防科学技术大学 2013

本文编号：3315857

资料下载

论文发表

支付宝下载

Download by Alipay
微信下载

Download by Wechat
会员下载

Download by Member

本文链接：https://www.wllwen.com/kejilunwen/zidonghuakongzhilunwen/3315857.html

上一篇：基于深度卷积神经网络的高分辨率遥感影像建筑物提取方法研究
下一篇：基于深度神经网络对抗与集成的不平衡数据分类方法研究

论文发表

·知网|万方|维普|龙源|省级|国家级|科技核心|北大核心|南大核心CSSCI|EI|SCI|SSCI|