Please wait a minute...
空天防御  2024, Vol. 7 Issue (5): 65-72    
0
  专业技术 本期目录 | 过刊浏览 | 高级检索 |
基于强化学习的多飞行器目标分配方法
刘华华1,2, 王青1,2
1. 北京航空航天大学 国际创新学院,浙江 杭州 311115; 2. 北京航空航天大学 自动化科学与电气工程学院,北京 100191
Multi-Aircraft Target Assignment Method Based on Reinforcement Learning
LIU Huahua1,2, WANG Qing1,2
1. International Innovation Institute of Beihang University, Hangzhou 311115, Zhejiang, China; 2. School of Automation Science and Electrical Engineering, Beihang University, Beijing 100191, China
全文: PDF(822 KB)  
输出: BibTeX | EndNote (RIS)      
摘要 针对复杂环境下多飞行器对多目标分配问题,本文提出了一种基于强化学习的多飞行器目标分配方法。首先,建立飞行器执行任务的战场环境模型,获取飞行器作战能力信息以及环境信息,并加以量化;其次,利用强化学习算法,进行多组飞行器作战目标分配;最后,考虑飞行器出现损毁情况,进行目标动态重分配决策,以提高在战场突发情况下的任务完成度。仿真结果表明了该算法的有效性。
服务
把本文推荐给朋友
加入引用管理器
E-mail Alert
RSS
作者相关文章
关键词 多飞行器目标分配强化学习环境不确定性    
Abstract:To resolve the multi-agent multi-target assignment problem in complex environments, a multi-agent target assignment method using reinforcement learning has been proposed in this study. Initially, a battlefield environment model for the execution of tasks by the aircraft was established, extracting and quantifying information on the aircraft's combat capabilities and environmental conditions. Then, a reinforcement learning algorithm was employed to assign multiple groups of combat tasks. Finally, considering aircraft combat losses, dynamic task reassignment was conducted to enhance task completion in response to sudden battlefield situations. Simulation results show that significant effectiveness of the proposed algorithm is achieved.
Key wordsmulti-aircraft    target assignment    reinforcement learning    environmental uncertainty
收稿日期: 2024-07-10      出版日期: 2024-11-23
ZTFLH:  TP 181  
基金资助:国家自然科学基金面上项目(61873295)
作者简介: 刘华华(1997—),男,博士研究生。
引用本文:   
刘华华, 王青. 基于强化学习的多飞行器目标分配方法[J]. 空天防御, 2024, 7(5): 65-72.
LIU Huahua, WANG Qing. Multi-Aircraft Target Assignment Method Based on Reinforcement Learning. Air & Space Defense, 2024, 7(5): 65-72.
链接本文:  
https://www.qk.sjtu.edu.cn/ktfy/CN/      或      https://www.qk.sjtu.edu.cn/ktfy/CN/Y2024/V7/I5/65

参考文献
[1] 全家乐, 马先龙, 沈昱恒. 基于近端策略动态优化的多智能体编队方法[J]. 空天防御, 2024, 7(2): 52-62.
[2] 马驰, 张国群, 孙俊格, 吕广喆, 张涛. 基于深度强化学习的综合电子系统重构方法[J]. 空天防御, 2024, 7(1): 63-70.
[3] 王旭, 蔡远利, 张学成, 张荣良, 韩成龙. 基于分层强化学习的低过载比拦截制导律[J]. 空天防御, 2024, 7(1): 40-47.
[4] 郭建国, 胡冠杰, 许新鹏, 刘悦, 曹晋. 基于强化学习的多对多拦截目标分配方法[J]. 空天防御, 2024, 7(1): 24-31.
[5] 李梦璇, 郭建国, 许新鹏, 沈昱恒. 基于近端策略优化的制导律设计[J]. 空天防御, 2023, 6(4): 51-57.
[6] 尚熙, 杨革文, 戴少怀, 蒋伊琳. 基于强化学习的一对多雷达干扰资源分配策略研究[J]. 空天防御, 2022, 5(1): 94-101.
[7] 何林坤, 张冉, 龚庆海. 基于强化学习的可回收运载火箭着陆制导[J]. 空天防御, 2021, 4(3): 33-40.
[8] 吴诗辉, 贾军, 鲍然, 周宇, 夏青元. 面向集群对抗的多弹协同目标分配模型与仿真分析[J]. 空天防御, 2021, 4(3): 1-9.
[9] 龙腾, 刘震宇, 史人赫, 王生印. 基于神经网络的防空武器目标智能分配方法[J]. 空天防御, 2021, 4(1): 1-7.
[10] 周来, 靳晓伟, 郑益凯. 基于深度强化学习的作战辅助决策研究[J]. 空天防御, 2018, 1(1): 31-35.
沪ICP备15013849号-1
版权所有 © 2017《空天防御》编辑部
主管单位:中国航天科技集团有限公司 主办单位:上海机电工程研究所 上海交通大学出版社有限公司