第35卷第11期 系统工程与电子技术 Systems Engineering and Electronics Vo1.35 No.11 November 2Ol3 2013年11月 文章编号:i001 506X(2013)11-2396 04 网址:www.sys—ele.corrl 伪谱法求解非光滑最优控制问题的网格优化 刘渊博,朱恒伟,黄小念,郑钢铁 (清华大学航天航空学院,北京10OO84) 摘要:伪谱法在求解非光滑最优控制问题时往往需要在迭代计算过程中进行网格优化,以提高对非光滑问 题的适应性。针对现有网格优化方法中分段点收敛至不光滑点速度较慢的问题,提出了分段点最佳化的思想,即 将分段点作为设计变量,根据误差曲线确定最佳分段点可能存在的区间,由求解器确定最佳的分段点位置,从而 提高分段点收敛至不光滑点的速度。算例表明,分段点最佳化的网格优化算法能较大程度地提高伪谱法对非光 滑最优控制问题的求解效率。 关键词:最优控制;网格优化;伪谱法;分段点最佳化 中图分类号:O 232 文献标志码:A DOI:10.3969/j.issn.1001—506X.2013.11.27 Optimal mesh segmentation algorithm for pseudOspectral methods for non。smooth optimal control problems LIU Yuan—bo,ZHU Heng—wei,HUANG Xiao—nian,ZHENG Gang—tie (School of Aerospace,Tsinghua University,Beijing 100084,China) Abstract:A mesh refinement algorithm is usually involved to improve the adaptability when using pseudospectral methods tO solve non—smooth optimal control problems.To increase the rate of the mesh break— points converging to the practical non—smooth points,an optimal mesh segmentation method is introduced to the existing mesh refinement algorithm.With the proposed method,breakpoints are taken as variables located in given intervals determined according to the error estimate,and delivered to the numerical solver tO be deter— mined.A numerical example illustrates that the optimal mesh segmentation method can efficiently improve the convergence rate for solving non—smooth optimal control problems with pseudospectral methods. Keywords:optimal control;mesh refinement;pseudospectra1 method;optimal mesh segmentation 0 引 言 况,以提高对状态变量的近似精度,从而使伪谱法更好地适 用于非光滑最优控制问题。然而在实际使用中,hp自适应 伪谱法是一类用于求解最优控制问题的数值解法, 伪谱法往往需要迭代多次才能达到较高精度,其主要原因 该类方法利用建立在正交点上的插值函数作为状态变 是该方法进行节点分段时,分段点收敛至不光滑点的速度 量的近似函数,运用配点法的思想将最优控制问题转化 较慢。 为非线性规划问题进行求解。常见的伪谱法包括Le— 为了解决hp自适应伪谱法的上述问题,我们在其基础 gendre伪谱法 ]、Guass伪谱法 ]、Radau伪谱法 和 上提出了分段点最佳化思想,即在确定分段点位置时将其 Chebyshev伪谱法” 等。由于伪谱法求解精度高、收敛 作为设计变量,而非给定固定值,通过优化确定最佳的分段 速度快,近年来,伪谱法在最优控制领域的应用越来越 点位置,使其能迅速地收敛至实际的不光滑点,从而提高伪 广泛…]。 谱法对非光滑最优控制问题的求解效率。 伪谱法属于全局法,在时间域内用全局插值得到的高 阶多项式对状态变量进行近似。当状态变量足够光滑时, 1 伪谱法 这种近似方式具有较高的指数阶精度,而当状态变量不光 1.1最优控制问题数学描述 滑时,其近似精度将明显降低 。针对这一影响,文 一般最优控制问题可以描述为:求解状态变量x( )∈ 献[14]提出了hp自适应伪谱法,其主要思想是根据当次计 ,控制变量H( )∈Rm和静态参数P∈R ,使得它们满足 算的误差情况优化接下来将采用的插值节点个数及分段情 约束 收稿日期:2012—12—17;修回日期:2013—07—21;网络优先出版日期:2013—08—22。 网络优先出版地址:http://www.cnki.net/kcms/detail/11.2422.TN.20130822.1352.006・html 第11期 刘渊博等:伪谱法求解非光滑最优控制问题的网格优化 ( )一k ̄f(x,H,p),k 一(rs一 )/2 l g(x,H,p)≤0 (1) I 。(‰,r。)一0,t∈[一1,1] 【 ,(xs,r,)一0 J—M(xr,r )+k IJ—i L(x,ll,p)dt (2) 式中,,为动力学函数;g为不等式约束函数; 和 为终 端约束函数;M、L分别为目标函数的梅耶项和拉格朗 日项。 为了推导简洁,在以上描述中一般性的时间区间 [ ,r,]通过等价的线性变换被转换到正交点集常用的 区间[一1,1]。 1.2伪谱法算法原理 根据所选择的正交点集的不同,伪谱法可分为前面提 到的多种伪谱法,它们在基本原理上是一致的。下面以 Legendre伪谱法为例,简要介绍伪谱法的算法原理。 首先,Legendre伪谱法将状态变量在Legendre—Gauss— Lobatto(LGL)正交点t ( ∈[O,N])上进行离散,利用拉格 朗日插值得到状态变量的近似函数 N ( )≈ ( )一 fJ(t)xj (3) 式中,z,(£)为拉格朗日插值基函数。 然后,利用配点法的思想在LGL点上对动力学方程进 行配点。对x(£)求导可得 N N ≈X(t )一∑2 ( ) 一∑D (4) 式中,[-D ]为微分矩阵。代入式(4),约束条件式(1)可转 化为代数约束,即 r N , ( p)一∑Ddx 一0, ∈[0,M l g(x ,ll ,p)≤0 。 … ’ f (‰,z'o)一0,i∈Eo,N] l r( N,"E1)一0 通过Gauss—Lobatto积分,目标函数式(2)可近似为 N J—M( N, )+k L(x ,“ ,p) (6) 式中, 为LGL点对应的积分权函数。 经过以上离散和约束转换过程,最优控制问题转化成 如下非线性规划问题_l :以状态变量、控制变量在LGL点 时刻的值置,H ( ∈[O,N])和参数p为静态优化参数,在满 足代数约束(5)的条件下,使目标函数-,取得最小值。转换 后的非线性规划问题可以通过比较成熟的非线性规划求解 器如SNOPT 等工具进行求解。 2网格优化算法 当状态变量非光滑时,伪谱法所采用的全局插值方式 的精度将受到很大影响,为了保证插值的高精度,就需要对 插值节点(网格)进行分段。以下通过实例详细分析节点分 段情况对插值精度的影响。 2.1 非光滑函数的插值精度分析 非光滑分段函数s(£)如图1所示,考虑对其进行插值 近似。 s㈤一JI , ≤ 。 (7) 2一e ,0≤t≤1 图1非光滑分段函数s(£) 从图1可以看出函数 (£)存在明显的不光滑点,将 该点记为t 一0。针对S(f)分别在无分段、分段点偏离 、分段点等于 的几种情况下进行基于LGL正交点的 拉格朗日插值,得到的最大插值误差随节点数的变化曲 线如图2所示。 + I—: : ?々 ■h 一 盱 譬 、^ 、L一 节点个数 +:无分段;一 一:t=le一4处分段; 一:t=5e一2处分段;一“:t=0处分段。 图2不同分段情况下的插值误差 对比图2中不同分段情况下的插值误差曲线,可以得出 以下结论:①加入分段点可以显著提高插值精度,且分段点位 置越接近实际的不光滑点,能达到的插值精度也越高。②当分 段点与实际不光滑点重合时,插值误差随插值节点个数的增加 呈指数阶减小,直至达到计算机的截断误差(约10 。)。 通过上述对 ( )的插值精度分析可以看出,在对非光 滑函数进行分段插值时,分段点的位置对插值精度起着决 定性作用。因此,如何准确确定分段点应是伪谱法求解非 光滑问题的网格优化算法中被关注的主要问题。 2.2分段点最佳化 在求解非光滑最优控制问题时,状态变量的不光滑点 往往是未知的,需要通过分析时间域内的误差曲线来确定。 由于拉格朗日插值在节点上的误差恒为零,所以将节点中 间点的插值误差作为分析对象。对函数s(z)做全局插值的 误差曲线如图3所示。可以看出,在不光滑点附近插值误 差达到极大值,根据误差曲线的这一特点从而可以判断不 光滑点的大概位置。 ・2398 ・ 系统工程与电子技术 第35卷 图3无分段插值的插值误差曲线 伪谱法进行网格优化时主要考虑式(1)中状态方程在 配点中间点上的误差曲线,其本质上和图3所示的插值误 差曲线是一致的。hp自适应伪谱法进行网格优化时主要 遵循以下原则 :①若误差曲线有明显极大值点,说明该 点附近存在不光滑点,需在该点处设置分段点。②若误差 曲线无明显极大值点,但求解精度不够时,则增加节点个 数。将上述原则应用于图3的误差曲线得到的优化结果为 在图3所示的t 时刻设置分段点。而事实上,t 与实际的不 光滑点t 一O之问存在明显的偏差。由图2可以看出,该偏 差仍会导致较大的插值误差。因此在实际计算时'hp自适 应伪谱法一般需要经历多次节点优化,通过在不光滑点附近 增加大量分段点以减小该偏差,从而达到指定的精度要求。 为了使分段点能够快速收敛至不光滑点,我们提出了 分段点最佳化思想。其遵循的判断原则和hp自适应伪谱 法基本相同,主要区别是设置分段点时,不给定固定位置, 而是将其作为设计变量t ,纳入到非线性规划问题(5,6) 中,根据误差曲线给出t 的上下限,由非线性规划求解器 计算最佳的分段点位置。理论上,最佳的分段点位置即为 不光滑点的所在位置,借助非线性规划求解器强大的求解 能力,这种方式能用较少的迭代次数使分段点收敛至不光 滑点。而式(5)~式(6)一般是含有较多设计变量的大规模 非线性规划问题,将少量的网格分段点作为设计变量纳入 其中并不会对其求解速度有明显影响,因此迭代次数的减 少即意味着计算效率的提高。利用该方法分析图3所示的 误差曲线,对应的网格优化结果为:增加新的分段点t ,且 ∈[£l,t2]。 2.3段内节点数的确定 根据图2的误差曲线可知,在对网格进行准确分段后 便可根据以下指数阶精度关系(8)准确设置节点个数。 lg e—n・N+b (8) 式中,e为插值误差;N为节点个数;“、b为常数。假设任意 2次计算节点数为N 和N ,所得结果的精度为 和P ,可 知当要求精度为 时,节点个数至少应为 ! 二 曼!:二 lg 2一lg Plg! ± 竖 (9) 3 数值算例 本节通过求解一个典型的非光滑最优控制问题:戈达 德火箭最大爬升高度问题 对比hp自适应伪谱法和分段 点最佳化方法的计算结果以及节点优化过程。 戈达德火箭最大爬升高度问题描述如下:假设火箭在 爬升过程中满足运动方程为 f 一(T—D)/m—g 1 __二 式中,火箭速度 、高度h、质量m、末端时间t,分别满足 h(0)一1, (O)一0,m(O)一1, m(t,)一0.6,0.1≤t ≤1 控制变量为发动机推力T(f),变化范围为 0≤丁(£)≤3.5 阻力D和重力加速度g分别为 D—D0 exp(-- ) g一1/h 式中,D。一3lO;口一500;f一0.5。以上描述中各量均采用国 际标准单位。 求最优的推力变化曲线T(t)和末端点时刻t 使得目 标函数-,取得最小值。 .,一一h(t,) 在相同的计算条件下,利用hp自适应伪谱法和分段点 最佳化方法求得的火箭最大爬升高度分别为1.025 34 m 和1.025 31 m,对应的最优状态变量和控制变量分别如 图4和图5所示。 t|s (b)控制变量的解 图4 hp自适应伪谱法的计算结果 对比以上计算结果不难看出,相比hp自适应伪谱 法,分段点最佳化方法使用很少的节点就得到了同样准 确的结果。二者的网格优化过程如图6所示,hp自适应 伪谱法经过9次计算在不光滑点附近增加了大量分段 点才使得分段点收敛至不光滑点。而分段点最佳化方 法仅进行了3次计算就确定了最佳的分段点位置并达 到了精度要求。在计算时间上,hp自适应伪谱法的求解 过程耗时39.2 S,而分段点最佳化方法仅用了8.1 s,具 有更高的求解效率。 第11期 嘲 葵 刘渊博等:伪谱法求解非光滑最优控制问题的网格优化 籁 琳 ・ 2399 ・ (b)控制变量的解 图5分段点最佳化方法的计算结果 节点位置 (a)hp自适应伪谱法的网格优化过程 籁 琳 节点位置 (b)分段点最佳化方法的网格优化过程 图6 2种方法的网格优化过程示意图 4 结 论 针对非光滑最优控制问题,本文在hp自适应伪谱法的 网格优化算法基础上,提出了分段点最佳化的网格优化算 法。分段点最佳化的网格优化算法将网格分段点作为设计 变量纳入非线性规划问题,由求解器确定最佳的分段点位 置,从而解决了hp自适应伪谱法在网格优化过程中分段点 收敛至实际不光滑点速度过慢的问题,提高了伪谱法对非 光滑最优控制问题的适应性和求解效率。 参考文献: [1]Elnagar G,Kazemi M A,Razzaghi^,L The pseudospectral legendre method for discretizing optimal control problems[J].IEEE Tram. on Automatic Control,1995,40(1O):1793—1796. [2]Elnagar G,Razzaghi M.A collocation type method for linear quadratic optimal control problems[J].Optimal Control Appli— cations and Methods,1998,18(3):227—235. E3]Benson D A.A Gauss pseudospectral transcription for optimal control[D].Cambridge:Massachusetts Institute of Technology, 2004. I-4]Benson D A。Huntington G,Thorvaldsen T T P,et a1.Direct trajectory optimization and costate estimation via an orthogonal collocation method[J].Journal of Guidance,Control,and Dy namics,2006,29(6):1435一l44O. fs]Huntington G T.Advancement and analysis of a Gauss pseudospec tral transcription for optimal control[D1.Cambridge:Massachusetts Institute of Technology,2007. [6]Garg D,Patterson M A,Darby C L,et a1.Direct trajectory optirniza tion and costate estimation of finite-horizon and infinite ̄horizon optimal control problems via a radau pseudospectral method[J].Computational Optimization and Applications,2011,49(2):335—358. [7]Vlassenbroeck J,Dooren R V.A Chebyshev technique for sol ving nonlinear optimal control problems[J].IEEE Trans.on Automatic Control,1998,33(4):333—340. [8]Vlassenbroeck J.A Chebyshev polynomial method for optimal control with state constraints[J].Automatica,1988,24(4):499—506. r 9]Dooren R V,Vlassenbroeck J.A new look at the brachisto chrone problem[J].Zeitschrift r Angewandte Mathematik und Physik,1980,31(6):785—790. [10]Fahroo F,Ross I M.Direct trajectory optimization by a Cheby shev pseudospectral method[J].Journal of Guidance,Con— trol,andDynamics,2002,25(1):160—166. [11]Fahroo F,Ross I M.Advances in pseudospectral methods for optimal control[C]ff Proc.of the Al A Guidance,Naviga tion and Control Con fefence and Exhibit,2008:1—23. [12]Canuto C G,Hussaini M Y,Quarteroni A,et a1.Spectral methods:evolution to complex geometries and applications to fluid dynamics[M].Heidelberg:Spinger Verlag,2007. [13]Fornberg B.A practical guide to pseudospectral methods[M]. Cambridge:University Press,1998. [14]Darby c L,Hager W W,Rao A V.An hFadaptive pseudospectral method for solving optimal control problems[J].Optimal Control Applications and Methods,2011,32(4):476—502. [15]Bazaraa M S,Sherali H D,Shetty C M.Nonlinear program ming:theory and algorithms[M].New York:Wiley,2006. [16]Gill P E,Murray W,Saunders M A.SNOPT:an SQP algo rithm for large—scale constrained optimization[J].SIAM Jour— nal on Optimization,2002,12(4):979 1006. [17]Bryson A E.Dynamic optimization[M].California:Addison Wesley,1999. 作者简介: 刘渊博(1984一),男,博士研究生,主要研究方向为匕行器总体设计。 E mail:liuyb03@mails.thu.edu.cn 朱恒伟(1968一),男,研究员,博士,主要研究方向为飞行器总体设计。 E mail:zhuhwei66@126.corn 黄小念(1977一),男,助理研究员,硕士,主要研究方向为飞行器总体 设计。 E mail:huang77728@163.corn 郑钢铁(1950一),男,教授,博士,主要研究方向为飞行器结构设计。 E mail:zhenggt@126.com