打开APP
userphoto
未登录

开通VIP,畅享免费电子书等14项超值服

开通VIP
【应用】基于演化深度神经网络的无人机协同无源定位动态航迹规划

针对多无人机在无源定位过程中协同动态规划航迹提高定位精度问题,提出基于演化深度神经网络的分布式动态航迹优化方法。首先将演化计算与深层前向反馈神经网络结合,设计基于演化神经网络的无人机协同无源定位动态航迹规划框架。以多无人机到达角(AOA)协同定位为例,利用定位过程中对目标估计的克拉美罗界(CRLB)生成最优训练集。通过无人机下一时刻与目标形成的相对构型作为系统学习的行为,从而得到下一时刻优化后的航迹点。实验结果表明,该方法相对于传统中心控制的无人机协同定位方法,具有更低的处理延时,能够以更短时间达到定位精度。



多无人机无源定位在环境监测、应急救援、军事侦察与电子战等领域的应用越来越多,如何规划无人机路径以提高定位精度已成为国际研究热点问题之一[1]。当前航迹规划研究主要有2个方面:

1)静态规划,即提前规划好无人机执行任务过程中所需的航迹路径;

2)给定无人机运动初始构型和目标构型,通过优化算法,在线计算连续且满足各种状态约束和环境约束的可行路径,使无人机完成从初始点到目标点的运动。


目前基于优化算法的路径规划方法要求无人机实时在线计算出下一时刻航迹点,因此需要不断进行航迹重规划。同时在这种情况下,无人机集群中需要有一个中心站用于目标位置解算以及给出下一时刻各个无人机航迹点,因此属于集中式控制。随着集群内无人机数目的增多,集群网络的鲁棒性降低。


考虑到无人机面临战场环境的突发性、不确定性的特点,通过模仿生物体的学习活动,使无人机在满足其平台约束的条件下,通过线下自主学习和线上分布式自主规划路径,从而提升执行任务过程中的航迹规划的实时性、准确性和适用性。因此,通过机器学习的方法对路径规划展开研究是当前热点问题之一。Kruusmaa应用基于案例推理的方法,通过建立机器人的环境注解地图数据库,将观测值与数据库进行检索匹配作为规划输出。该方法所需的数据库较大且不适用于动态环境中。Chen等给出了基于Q学习的机器人导航方法。Zhao等研究了基于证据推理理论对无人机水面舰艇的冲突解脱进行评估,并通过学习得到最优防相撞策略,可借鉴到无人机应对空中威胁的路径规划方法中。Zhang等[7]研究了基于几何强化学习算法,提高了单机和多机协同下的路径规划能力。上述研究主要解决了无人机在任务中的地形避障、最短路径、防相撞等问题,本研究主要以无人机无源定位任务为牵引,给出无人机执行任务所需的最优航迹。


主要研究基于演化深度神经网络的无人机无源定位动态航迹规划方法。首先给出基于演化神经网络的无人机航迹规划框架。在此基础上,以多无人机纯方位定位为例,分析其最优构型的影响关系。其次,应用基于差分进化的演化深度神经网络对网络参数进行调整优化,提升网络的准确性与鲁棒性。


1问题分析与传统解决方法


1.1 问题描述与分析


本研究以多无人机纯方位定位为例,考虑M架无人机执行目标定位任务,其中M个无人机与目标之间的相对构型如图1所示,其中表示第i个接收机的位置,为目标位置,r表示第i架无人机到目标的距离,相邻的无人机与目标连线之间夹角为


其中每架无人机的AOA量测方程为:

+ei,ei表示量测误差,且服从均值为0方差为
的高斯分布,即
可表示为

M个无人机的量测值组成测量向量表示为

,假设不同接收机的量测误差相互独立,且误差协方差

,其中IN为N维的单位矩阵。


利用无人机进行分布式AOA定位的效果主要受2个因素的影响:

1)定位算法的选取(最大似然ML,最小二乘LS,EKF滤波等);

2)无人机与目标之间的几何分布构型。


因此在定位算法一定的情况下,对目标定位和跟踪的精度受到各个无人机与目标之间构型的影响,在实际应用中,需要不断调整与目标之间的相对构型从而得到更好的定位精度以及定位的稳定性。


1.2 无人机运动模型


假定多无人机系统的离散动态模型为

式中,Xk为k时刻系统的状态值

,uk为每个时刻对无人机飞行方位角的控制量
。由此可得离散情况下无人机的运动方程为


式中,ν0为无人机飞行速度,T为接收机采样时间间隔。每一间隔时间内,应用Chan算法更新目标位置,同时以克拉美罗界CRLB为优化目标函数,得到下一时刻最小测量误差情况下的控制量u(k+1),因此目标函数可以表示为

式中,约束条件(4)表示平台自身航向角约束。条件(5)(6)分别表示无人机平台到目标之间的距离约束,距离上限Rh主要由接收机信噪比决定,距离下限Rl为无人机平台与目标之间的安全距离。条件(8)(9)分别为无人机之间通信约束以及无人机防相撞约束。


1.3 传统的多无人机无源定位在线航迹规划框架


传统的无人机协同定位航迹规划问题是将其转化为带约束的非线性优化问题,通常解决该问题可以通过内点罚函数法解决。内点罚函数法可以将该非线性约束转化为极小化辅助函数的无约束问题,其计算步骤如下。


Step1:给定k时刻各个无人机系统状态

,AOA测量值Zk,以及约束条件(4)~(6)。

Step2:利用ML算法对目标定位值

,以及经过EKF滤波后的估计值

Step3:对于约束中的非线性约束(5)~(6),其可行域定义为


得到对数障碍函数

式中,γ为对数障碍参数,γ→0,


从而将非线性约束转变为无约束问题,通过设置起始内点求解

的最小值。


Step4:对于线性约束(12),为简化计算,将Step3中求解的u(k+1)代入约束不等式。如果满足约束条件则为最终的输出结果,如果不满足约束则选择边界值umax。

Step5:得到无人机下一时刻的控制量u(k+1)以及下一时刻的主站的选取。


因此传统的多无人机无源定位在线航迹规划框架如图2所示。


2基于演化深度神经网络的多无人机无源定位在线航迹规划



2.1 基于演化深度神经网络动态航迹规划框架


基于演化深度神经网络的无人机在线航迹规划框架由2部分组成(图3),分为在线使用和学习训练部分。

图3给出了基于演化深度神经网络的在线使用流程,与传统的多无人机无源定位在线航迹规划框架相比,应用演化神经网络,只需要每个时刻对目标的估计值以及当前时刻各个无人机的位置信息,将其输入每个无人机的神经网络,从而每个网络产生无人机下一时刻的控制量,即为下一时刻的航迹点。


该自主规划框架与单一的路径规划算法相比,有3大优势,一是不需要实时在线优化,极大地降低了计算成本,保证了控制输出的实时性。二是建立了由状态到行为的映射关系,更加接近人在规划时的智能。与此同时,避免了传统规划的集中式控制,提升了系统的鲁棒性。三是在该框架下,每架无人机对应一个路径规划的神经网络,无人机下一时刻的航迹控制指令至与该时刻无人机与目标估计值之间的构型相关,因此节省了通信资源。


对于动态规划的神经网络学习框架如图4所示。

具体步骤如下。

Step1:依据构建好的神经网络,确定神经网络输入集以及最优的输出数据集。其中最优的输出数据集可以由目标估计值的克拉美罗界CRLB给出。

Step2:将生成的样本集输入每个无人机的演化神经网络中,并行训练。

Step3:将演化神经每个神经网络输出的数据集与最优数据的差形成其评价值。

Step4:应用差分进化算法生成下一代神经网络种群。

Step5:得到最优神经网络,结束学习。


2.2 深度神经网络架构设计


引入深度神经网络,该深度网络的拓扑结构如图5所示,包括输入层、输出层和隐含层,各神经元与下一层所有的神经元连接,同层神经元之间无连接。根据试验数据和先验知识,根据无人机协同数量、无源定位信号处理机制、以及相关探测、通信和防碰撞约束,可将隐函层数量设置为3~10层。

网络的输入为无人机与目标估计值之间的相对位置(相对角度与距离);网络输出值为下一时刻无人机i在坐标轴x轴速度大小,y轴速度大小和z轴速度大小;因此对于M个无人机,该神经网络表征着有2M个输入,3个输出的一个非线性系统,其中最优输出数据集为下一时刻考虑平台约束下CRLB最小值对应的最优角度和距离为


2.3 差分进化演化计算网络权重


演化算法(evolutionaryalgorithm,EA)是一种求解问题的自适应、自组织的随机优化算法。演化算法以其模仿演化过程、全局优化搜索能力以及不像反向传播算法法存在梯度消失或爆炸的特性,使其在优化、搜索和设计问题方面有着很大的研究价值,为传统神经网络所出现的问题提供了解决方案和途径[11]。采用基于差分进化的神经网络进化算法对2.2节所构建的网络的权重进行训练,具体步骤如下。


Step1:初始化。选定网络结构和学习规则,同时将神经网络的连接权重初始化为随机值;初始化种群规模、交叉系数、缩放因子、最大进化代数以及初始变异算子等参数。

Step2:变异。计算在每个种群对应的神经网络的演化算法(evolutionaryalgorithm,EA)是一种求解误差函数,从而给出适应度值评价,根据神经网络的输入,获得神经网络的实际输出误差越小,适应度值越高的个体。

Step3:交叉。利用交叉操作算子对当前一代群体进行变换,产生出新一代个体。

Step4:选择。按照贪婪准则将实验向量与当前种群中的目标向量进行比较。

Step5:边界条件处理。在有边界的约束问题中,必须保证产生新个体的参数值位于问题的可行域中。

Step6:重复上述Step2~Step5,使网络权重值分布不断优化,直至达到训练目标为止。


3仿真分析


考虑采用2架无人机对静态目标进行定位,目标初始位置为xt=(0,0),无人机初始状态为:

,初始时刻无人机均沿着y轴方向飞行,飞行速度为
,仿真步长为T=100。信噪比
,通信半径
,防碰撞半径
,最大偏转角


图6(a)为基于传统方法的航迹规划结果,红三角为目标位置,蓝色圆圈为每个仿真步长下目标的估计值,绿线和红线分别为无人机1和无人机2的航迹。由图6(a)可得,各个无人机都尽量向着相互远离的方向飞行,两架UAV都在使与目标之间的夹角

尽量变大(最优夹角应为
)。

同时注意到无人机在初始时刻的构型下各个UAV与定位误差较大,不能够得到有效的目标信息,因而前10个仿真步长内无人机飞行方向变化不大,随着θi的变化定位误差变小,UAV飞行方向也不断变化最终趋向固定值


图6(b)为基于演化神经网络的航迹,与传统的航迹相似,都是在初始时刻向着相互远离的方向飞行,当获得一定的角度后,双机开始向着目标飞行。图6(c)为双机保持初始构型朝目标估计值飞行时的航迹与定位点迹。图6(d)为经过100次蒙特卡洛仿真得到在3种飞行航迹下的定位误差。对比可得,采用传统方法和基于演化深度神经网络规划方法得到的定位结果差别不大,且都可以在尽量短的时间内实现定位误差迅速降低,随着时间推移定位精度不断提升,而采用固定编队构型的定位误差较大且具有较强的不确定性。

为进一步说明基于演化神经网络航迹规划的优势,图7给出了采用传统航迹规划与演化神经网络航迹规划的所需时间的对比。

由图7可得,采用基于演化深度神经网络的规划方法在所需时间上有巨大的优势(平均每个步长耗时

,相比于传统优化方法(平均每个步长耗时1.2747s),省去了每一个步长内重复调用优化算法引起的时间消耗。在无人机数目增加的情况下,基于演化神经网络方法的优势将更加突出。综合图6和图7,本研究与传统方法相比,均能达到相同定位精度,但本方法极大缩短了定位时间。


4结论



针对多无人机在无源定位过程中的协同航迹优化问题,提出了基于演化深度神经网络的分布式协同动态航迹规划方法。由于本方法本质上是将多无人机无源定位协同航迹规划中的动态优化问题转换为带行为序列的连续预测问题,并运用深度神经网络进行解决,从而加大缩短了定位时间,另一方面是将传统方法多无人机中心处理、中心控制转化各无人机分布式学习自主运行,从而提高整体的鲁棒性和抗毁性。下一步的研究工作:在问题层面,继续考虑移动辐射源和多个辐射源的协同定位问题;在方法层面,考虑基于多智能体强化学习的思路,进一步高效解决多无人机无源定位协同航迹规划问题。

本站仅提供存储服务,所有内容均由用户发布,如发现有害或侵权内容,请点击举报
打开APP,阅读全文并永久保存 查看更多类似文章
猜你喜欢
类似文章
基于智能优化算法的无人机航迹规划若干关键技术研究
|笔记|无人机航路规划及视景仿真系统设计与实现
无人机航迹规划常用算法综述
基于神经网络自适应PID的无人机编队避障飞行控制研究
多无人机(UAV)协同任务分配
【学术论文】基于改进人工势场法的无人机在线航路规划算法
更多类似文章 >>
生活服务
热点新闻
分享 收藏 导长图 关注 下载文章
绑定账号成功
后续可登录账号畅享VIP特权!
如果VIP功能使用有故障,
可点击这里联系客服!

联系客服