受限状态下的高速列车迭代学习控制方法研究

迭代学习控制(Iterative Learning Control， ILC)是在有限区间内处理重复运行系统跟踪控制问题最有效的方法之一，其特点是原理简单、易于实现且对模型要求不高，是一种近乎无模型的前馈学习控制算法。自1978年日本学者Uchiyama提出迭代学习控制理论至今[1]，国内外专家学者对其做了大量的工作[2-5]，逐步形成了具有严格数学描述的控制理论体系。目前，对迭代学习控制的研究和应用已遍及工业生产的方方面面，如工业机器人[6，7]、数控机床[8]、工业化学反应堆[9]、注模机[10]、列车自动驾驶系统[11]和汽车防抱死系统[12]等。

高速列车自动驾驶系统是一个具有高度重复性的控制系统，具体表现为运行环境的重复性、运行计划的重复性、运行目标的重复性以及列车动力学模型的重复性。文献[13]首次将ILC思想引入到列车自动驾驶系统中，文献[14]研究了距离域反馈、迭代域前馈学习的列车自动驾驶控制方法，基于距离域建模，结合压缩映射方法，控制列车逐渐逼近期望轨迹。文献[15]提出预测迭代学习控制算法来处理系统输入受限问题，实现对期望轨迹的精确跟踪，但需要知道控制系统的精确模型。文献[16]设计了一个动态建模的ILC算法，通过递推最小二乘法辨识模型参数，基于范数最优理论，实现对跟踪误差关于2范数收敛，但没有考虑系统初态和受限问题。

系统受限问题普遍存在于现代工业控制系统中，主要表现为输入受限和状态受限。目前，对于控制系统受限问题下的迭代学习控制研究已有了大量的研究成果，文献[17]设计了一个双环ILC控制器来解决系统输入受限问题，ILC环1用来学习标称系统的控制器，ILC环2则用来拟合非线性控制输入项，但是双环结构复杂且独立工作。文献[18]以受限状态下的Euler-Bernoulli梁结构为研究对象，在非周期性分布式扰动和边界扰动作用下，建立了基于时间加权的Lyapunov-Krasovskii能量函数，实现了跟踪误差沿迭代轴的渐进收敛。文献[19-20]将饱和函数sat(·)引入输入受限控制系统的研究中。文献[21]针对一个线性状态受限的系统，将迭代学习控制问题转化为凸函数优化问题，证明了算法的跟踪误差是关于2范数收敛的，但是没有对非线性系统进行深入研究。文献[22]利用双曲正切函数和饱和函数处理机械手控制系统输入受限问题，实现跟踪误差随迭代轴的渐进收敛。

（1）完善邮轮口岸信息平台建设。自主化通关举措、梅沙系统的应用、网络申报、入境预检等举措都是邮轮港口现代化信息平台的体现。进一步完善邮轮口岸信息平台建设，实现我国邮轮航线区域内的信息共享和联动能够跨越式的提升通关便利化进程，提升邮轮口岸通关运营效率。

与大多数工业控制系统相同，高速列车自动驾驶系统也是一个受限的控制系统，主要体现为执行器物理结构对控制输入的限制、线路的固定限速和临时限速等。本文充分考虑上述限制因素，针对时变、非线性的高速列车自动驾驶控制系统，提出一种受限状态下的迭代学习控制算法，建立类Lyapunov函数的复合能量函数，对所设计的算法的收敛性进行证明，通过计算机仿真验证，证明了算法的有效性。

1 问题描述

为便于描述，通常将列车看作是一个刚性质点，理想状态下的列车动力学模型可以表示为

(1)

式中，i为系统迭代运行次数；x1，i(t)为列车运行距离，m；x2，i(t)为列车运行速度，m/s；f(Xi，t)为列车运行的单位非线性阻力函数，N/kg；b为系统的输入增益，这里取列车的质量的倒数1/M；ui(t)为列车的输入牵引力/制动力，kN；fb(t)为列车的单位基本阻力，N/kg；fa(s)为线路上的单位附加阻力，包括坡道附加阻力fg、曲线附加阻力fc和隧道附加阻力ft，N/kg；a0，a1，a2分别为列车基本阻力函数的系数。

列车在实际运行过程中会受到以下两方面的限制。

(1)输入受限

umin(t)≤ui(t)≤umax(t)

(2)

式中，umax(t)，umin(t)分别为系统控制输入的上、下界。

(2)状态受限

古希腊哲学家崇尚求真的认知理性。巴门尼德指出：“作为述说，作为思维一定是存在的东西”，“思维与存在是同一的。”［2］92在他看来，只有理性才能表述本真的存在。柏拉图将巴门尼德能思的存在抽象化为独立的理性本体——“理念”，世界被二分为理念与现象二重性存在，顺次便有了真理与意见之划界，真理只有通过理性才能获得。如果说在柏拉图那里，直插云端的理念世界与垂直向下的现象世界之间还有剥离不清的瓜葛，那么在亚里士多德哲学中，纯形式阻断了与感性世界的任何纠缠，标举着以学术为目的的智慧之学——哲学研究对象初步确立。从此，“确定分离的纯形式的存在方式及其本质，这是第一哲学的任务”［3］49。

社会距离：指各社会存在体之间在空间、时间和心理上的距离。而在我的这项研究里，指的是心理上的距离，也就是指社会中个人之间情感亲密度、关系紧密度的概念。在这里我需要测量的是城市人口与迁移人口之间的社会距离，在2005年的CGSS调查问卷中，询问了城市居民对外来人口的态度，问题涉及了五项内容，分别是：

xk，min(t)≤xk，i(t)≤xk，max(t)

(3)

式中，k为系统阶数，k=1，2；xk，max(t)，xk，min(t)分别为系统状态信息的上、下界。

调查问卷主要包括6个问题，分别是景观一致性、复杂性、易辨性、神秘性、新奇度和美感度，分值设置为1～9分。

考虑系统受限情况，可以将式(1)改写为

(4)

式中，

为系统的控制输入上界；sat(·)为饱和函数，定义如下

(5)

本文的控制目标是，对于给定的列车运行期望曲线xd，在式(2)、式(3)限制条件下，基于迭代学习控制理论，找到一个最优的控制序列ui(t)，使得当i→∞时，系统能够精确跟踪期望曲线。

为方便控制器设计，提出如下合理假设。

（195）毛叉苔 Apometzgeria pubescens（Schrank.）Kuwah.刘胜祥等（1999）；熊源新等（2006）；杨志平（2006）；李粉霞等（2011）；余夏君等（2018）

假设1：列车在每次运行前满足相同的初始条件，即

Xi(0)=Xd(0)， ∀i∈Z*

(6)

假设2：存在一个最优的控制序列ui(t)，使得列车能够在有限时间t∈[0，T]内完全跟踪上期望的轨迹曲线。

为便于对下一节控制器收敛性的分析，这里给出关于饱和函数的性质。

性质1[23]：对于a，b∈Rm，如果参数a满足

那么，满足

公共课和基础课为校内笔答考试方式；校企共同开发的课程由校企双方共同考核；企业单独上的课程完全由企业自行考核。校企共同考核课程根据上课的内容的比例确定双方给出成绩所占的比例。企业考核课程，根据每门课程的内容，制定相应的考核单，实施过程考核，并且把对员工的基本要求纳入考核。

(7)

2 控制器设计

在设计控制器之前，首先定义系统的跟踪误差ei(t)=xi(t)-xd(t)，进一步，系统在第i次迭代的扩展误差可以表示为

si(t)=c1e1，i+e2，i

(8)

定义系统第i次迭代的Lyapunov函数为

本研究通过对恩施9个不同产地的三百棒药材样品的HPLC指纹图谱研究，发现有14个共有峰；利川市建南镇、利川市团堡镇、恩施市鹤峰县燕子乡、恩施市巴东县野三关镇所产的药材样品与对照药材比较相似度均大于0.90，其余产地药材样品相似度均小于0.90。结果表明，利川市建南镇、利川市团堡镇、恩施市鹤峰县燕子乡、恩施市巴东县野三关镇所产三百棒药材质量相对较佳。而该4个产地均处于较高海拔地区，三百棒药材质量是否与其产地的海拔高度有关还有待进一步研究。

(9)

上式关于时间t求导，可得

(10)

式中，β为Lyapunov函数系数向量，

为模型状态向量，

为满足Lyapunov稳定性要求，对于重复运行的列车自动驾驶系统，基于迭代学习的思想，在受限情况下，设计如下控制器

(11)

时变的模型系数向量βi可以通过饱和函数和迭代学习的思想来实现，表示为

(12)

式中，γ为系数向量的参数更新增益；

为学习增益βi的上界，可以通过工程实践经验或人为设定得到。

3 收敛性分析

针对高速列车自动驾驶系统，给出所设计控制律的收敛性分析，下述定理是主要的结论。

定理1：对于高速列车自动驾驶系统模型式(1)执行重复运行任务时，应用迭代学习控制器，本文所设计的控制律和学习增益更新律具有以下的性质。

(L1)∀t∈[0，T]，当迭代次数i趋向于无穷时，跟踪误差向量ei(t)趋向于零。

(L2)系统状态信号ui(t)，xi(t)均有界，且在任意时刻任意迭代次都能满足约束条件(2)和(3)。

证明首先，构造类Lyapunov的复合能量函数(为了表述清晰，会对函数的表达作一定的简化)

(13)

式中，δβi为时变学习增益的估计误差，δβi=β-βi。

接下来，分别对定理1中的(L1)、(L2)部分进行证明。

(1)定理1中(L1)部分的证明

首先，在迭代域对复合能量函数Ei(t)进行差分，得到

ΔEi(t)=Ei(t)-Ei-1(t)=

(14)

式中，Δδβi为δβi在迭代轴的差分，Δδβi=δβi-δβi-1。

15例研究组患者治愈10例（66.66%），有效4例（26.67%），无效1例（6.67%）；15例对照组患者治愈6例（40.00%），有效6例（40.00%），无效3例（20.00%）；研究组临床有效率为93.33%，对照组临床有效率为80.00%，研究组的临床有效率高于对照组，差异有统计学意义（P＜0.05）。说明在保留灌肠法治疗溃疡性结肠炎中应用舒适护理，有利于患者的痊愈。

令

将参数学习更新律式(11)代入上式第二项中，得

(βi-1-βi)dτ=

虽然在屋檐下，虽然没有粗重的檐溜滴下来，但每一阵风会得把凉凉的雨丝吹向我们。我有着伞，我可以如中古时期骁勇的武士似地把伞当作盾牌，挡着扑面袭来的雨的箭，但这个少女却身上间歇地被淋得很湿了。薄薄的绸衣，黑色也没有效用了，两支手臂已被画出了它们的圆润。她屡次旋转身去，侧立着，避免这轻薄的雨之侵袭她的前胸。肩臂上受些雨水，让衣裳贴着了肉倒不打紧吗？我曾偶尔这样想。

2．立足彰显教学理论的民族特色与自主创新。一改同类教材的理论大都介绍、移植西方教育教学理论和思想的“从属理论”现象，注重充实了以我国古今优秀教学理论思想为根基和指导的内容;立足继承和弘扬中华民族有生命力的教育教学思想，走自主创新的道路，吸收新课程改革中合理的实践证明是正确的理念和成果，坚持“厚今而不薄古，基中可以融洋”的原则。如:把孔子等儒家教学思想和《学记》中有关内容对化学教学的启示进行了阐述。同时把作者近些年来研究的新成果，如:“教学最佳时机理论”“有限教学理论”和“杨思学习模式”“杜郎口学习模式”等融合纳入本教材。

(15)

根据性质1，当

时，有

(16)

成立。

C3={{1,4,5},{2,4,5},{3,4,5},{1,2,3,4},{1,2,3,5},{1,2,4,5},{1,3,4,5},{2,3,4,5},

因此，利用上式可以将式(15)改写为

(17)

对式(14)第一项，将控制律式(11)代入，可以得到

(18)

将上两式代入到式(14)中，得

(βi-1-βi)dτ-

(β-βi)Tsiςidτ-Vi-1(t)=

(19)

由于上式中两项均具有正定性，因此式(19)成立，即能量函数沿迭代轴具有差分负定性。

接下来，将对E0(t)的有界性进行证明。令i=0，将式(13)重写为

(20)

对上式关于时间t求导，可得

2.2.1 对照品溶液精密称取橙皮苷对照品5.50 mg，置于50 mL量瓶中，加甲醇溶解并稀释至刻度，摇匀，得质量浓度为0.11 mg/mL的对照品溶液。

(21)

考虑到∀t∈[0，T]，β-1=0，可以将上式改写为

(22)

因此，可以得到

(23)

由于β为已知闭区间上的连续函数，且有界，因此，必然存在一个已知上界D*，使得

(24)

那么，式(20)就可以表示为

E0(t)=E0(0)+

E0(τ)dτ≤D*T≤∞

(25)

根据复合能量函数Ei(t)的差分负定性，可以将第i次迭代学习的能量函数表示为

(26)

对上式两端取极限

(27)

由于能量函数Ei(t)是正定的，且E0(t)在时域[0，T]上有界，所以根据级数收敛的条件，可以得知，当迭代次数i趋于无穷时，有

一是合理把握教材的难度．例题之间应留有合适的坡度，可以给学生探索和思考留白，但跨度太大，会对学生认知造成人为障碍．如何由“教材”转变为“学材”，中国台湾（甚至新加坡）等地的教材都能给予很好的启示．

(28)

即列车运行的跟踪误差在迭代域上会逐渐收敛到零。

(2)定理1中(L2)部分的证明

由于能量函数Ei(t)的正定性，且E0(t)在时域[0，T]上是有界的，那么根据式(27)，Ei(t)在时域[0，T]上也是有界的。另外，根据上述的级数收敛定理，当迭代次数i趋于无穷时，系统跟踪误差ei(t)也会收敛到零。根据学习增益更新律式(12)，在饱和函数意义下，可以得出结论，时变的学习参数向量βi(t)同样是有界的。

此外，基于迭代学习控制的控制目标可达性可以描述为存在一系列的控制输入ud(t)，使得系统可以完全跟踪上期望运行曲线。那么，对于∀t∈[0，T]，系统状态xd(t)是有界的。又由于系统实际的控制状态可以描述为xi(t)=xd(t)+ei(t)，根据ei(t)的有界性，可知，系统状态xi(t)也是有界的，由此可知，控制输入ui(t)同样是有界的。

4 算例仿真

以高速动车组某型车作为仿真对象，仿真线路长度为112.46 km，计划运行时间为1 800 s。列车线路上受到的附加阻力如图1所示，根据列车动力学模型和线路条件，求解出列车在区间的期望速度曲线和期望位移曲线，如图2所示。通过Matlab仿真，将PID控制算法和D型迭代学习控制算法，与本文提出的受限状态下的迭代学习控制算法进行比较，验证算法在受限状态下的有效性和收敛性。

图1 列车单位附加阻力

图2 列车运行期望速度和位移曲线

(1)PID反馈控制算法

工业上广泛使用PID反馈控制器，控制律设计如下

(29)

式中，Kp为控制器的比例项系数，取0.5；Ki为控制器的积分项系数，取0.1；Kd为控制器的微分项系数，取10。

(2)D型迭代学习控制算法

列车的初次迭代采用(1)的PID反馈控制器得到，从第2次开始，采用如下D型迭代学习控制器

(30)

式中，G为常学习增益，G=[g1，g2]T，取g1=1.5，g2=3。

(3)本文提出的参数化迭代学习控制算法

列车的初次迭代同样采用(1)的PID反馈控制器，根据所提出的迭代学习控制律和参数更新律，设置c1=1，θi(0)=[0，0，0]T，参数向量θ(t)的上界定义为θmax(t)=[1，0.01，0.000 5]T，下界定义为θmax(t)=[0.01，0.001，0.000 05]T，参数更新增益矩阵γ=[0.01，0.000 4，0.000 000 4]T。

图3 PID控制跟踪效果

图4 D型迭代学习控制跟踪效果

图5 本文所提出的迭代学习控制跟踪效果

由图3～图5可以看出，当列车进行工况转换时，PID反馈控制会产生较大的暂态，导致列车运行偏离期望轨迹；而D型迭代学习控制器对期望曲线跟踪的收敛速度较慢，且控制输入会超过执行器上界，不利于列车安全运行；而本文提出的受限状态下的迭代学习控制算法，通过饱和函数sat(·)的作用，保证列车运行控制输入和状态始终在允许范围内，并且能够较快地跟踪上期望轨迹曲线。

图6 三种控制算法的距离跟踪误差对比

图7 3种控制算法的速度跟踪误差对比

图6和图7给出了3种控制算法在距离和速度跟踪误差的对比图，可以看出，PID算法由于没有学习机制，无法随着迭代次数提高距离和速度的跟踪精度；D型迭代学习控制算法由于没有对控制系统模型的学习，因此跟踪收敛速度较慢；而本文提出的迭代学习控制算法，可以很好的学习系统的重复性信息，达到较快的收敛速度和跟踪精度。

5 结论

为分析在受限状态下高速列车的跟踪控制问题，首先建立了在受限状态下的列车动力学模型，然后根据扩展误差建立Lyapunov函数，推导出基于迭代学习控制的控制律和参数更新律，并给出严格的数学收敛性分析，最后通过计算机仿真对所提出的算法进行验证，分析其对期望运行轨迹的跟踪性能，主要结论如下。

(1)饱和函数sat(·)可以有效限制列车自动驾驶系统执行器的控制输入过大问题，保证了系统的运行安全。

(2)通过严格的数学证明，验证了所提出的控制律沿迭代轴可以达到渐进收敛，证明了算法收敛性和稳定性。

(3)通过计算机仿真验证以及与PID算法和D型迭代学习控制算法对期望运行轨迹跟踪性能的比较，证明所提出的算法具有较快的收敛速度和较高的跟踪精度，且能够保证控制输入在允许的范围内。

参考文献：

[1] UCHIYAMA M. Formation of high-speed motion pattern of a mechanical arm by trial[J]. Transactions of the Society of Instrumentation and Control Engineers， 1978，14(6):706-712.

[2] 刘国荣，张扬名.移动机器人轨迹跟踪的模糊PID-P型迭代学习控制[J].电子学报，2013，41(8):1536-1541.

[3] 严求真，孙明轩，李鹤.任意初值非线性不确定系统的迭代学习控制[J].自动化学报，2016，42(4):545-555.

[4] BRISTOW D A， ALLEYNE A G. A manufacturing system for microscale robotic deposition[C]∥American Control Conference， Denver， USA， 2003，3:2620-2625.

[5] BARTON K L， ALLEYNE A G. A norm optimal approach to time-varying ILC with application to a multi-axis robotic test bed[J]. IEEE Trans. Control Syst. Technol.， 2011，19(1):166-180.

[6] KAWAMURA S， MIYAZAKI F， ARIMOTO F. Iterative learning control for robotic systems[C]∥Proc. Int. Ind. Electron.， Contr. and Instrum.， 1984:393-398.

[7] 郝晓弘，李翠明.一种机器人轨迹跟踪控制的迭代学习方法[J].科学技术与工程，2008(7):1813-1817.

[8] ALTINTAS Y， BER A A. Manufacturing Automation: Metal cutting mechanics machine tool vibrations and CNC design[J]. Applied Mechanics Reviews， 2013，54(5):B54.

[9] NAGY Z K， MAHN B， FRANKE R, et al. Evaluation study of an efficient output feedback nonlinear model predictive control for temperature control of industrial batch reactors[J]. Control Eng. Pract.， 2007，15(7):839-850.

[10] GAO F， YANG Y， SHAO C. Robust iterative learning control with applications to injection molding process[J]. Chem. Eng. Sci.， 2001，56(24):7025-7034.

[11] JI H H， HOU Z S， ZHANG R K. Adaptive iterative learning control for high-speed trains with unknown speed delays and input saturations[J]. IEEE Trans. Autom. Sci. Eng.， 2016，13(1):260-273.

[12] MI C， LIN H， ZHANG Y. Iterative learning control of antilock braking of electric and hybrid vehicles[J]. IEEE Trans. Veh. Technol.， 2005，54(2):486-494.

[13] MENG T， HE W. Iterative learning control of a robotic arm experiment platform with input constraint[J]. IEEE Trans. Ind. Electron.， 2018，65(1):664-672.

[14] WANG Y， HOU Z S， LI X Y. A novel automatic train operation algorithm based on iterative learning control theory[C]. IEEE International Conference on Service Operations and Logistics， and Informatics. 2008:1766-1770.

[15] SUN H Q， HOU Z S， TANG T. An iterative learning approach for train trajectory tracking control[C]. The 18th IFAC World Congress， Milano， Italy， 2011，44(1):14916-14921.

[16] SUN H Q， HOU Z S. An iterative predictive learning control approach with application to train trajectory tracking[C]. Asian Control Conference， Istanbul， Turkey， 2013:1-6.

[17] YU Q X， HOU Z S， XU J X. D-type ILC based dynamic modeling and norm optimal ILC for high-speed trains[J]. IEEE Trans. Control Syst. Technol.， 2017，26(2):652-663.

[18] TAN Y， DAI H H， HUANG D Q, et al. Unified iterative learning control schemes for nonlinear dynamic systems with nonlinear input uncertainties[J]. Automatica， 2012，48:3173-3182.

[19] HE W， MENG T， HUANG D, et al. Adaptive boundary iterative learning control for a Euler-Bernoulli beam system with input constraint[J]. IEEE Trans. Neural Netw. Learn. Syst.， 2018，29(5):1539-1549.

[20] ZHANG R K， HOU Z S， CHI R H, et al. Adaptive iterative learning control for nonlinearly parameterized systems with unknown time-varying delays and input saturation[J]. Int. J. Control， 2015，88(6):1133-1141.

[21] ZHANG R K， HOU Z S， JI H H, et al. Adaptive iterative learning control for a class of nonlinearly parameterized systems with input saturations[J]. Int. J. Syst. Sci.， 2016，47(5):1084-1094.

[22] MISHRA S， TOPCU U， TOMIZUKA M. Optimization-based constrained iterative control[J]. IEEE Trans. Control Syst. Technol.， 2011，19(6):1613-1621.

[23] SUN M， GE S S. Adaptive repetitive control for a class of nonlinearly parametrized systems[J]. IEEE Trans. Autom. Control， 2006，51(10):1684-1688.

本站仅提供存储服务，所有内容均由用户发布，如发现有害或侵权内容，请点击举报。