CORC  > 自动化研究所  > 中国科学院自动化研究所  > 毕业生  > 博士学位论文
题名等周约束最优控制问题及其逆问题研究
作者李涛
答辩日期2024-05-12
文献子类博士
关键词最优控制 逆最优控制 等周约束 自适应动态规划 智能控制
英文摘要

在最优控制理论中,等周约束指的是使代价函数小于给定上界的约束。等周约束最优控制的研究旨在求解最小化一个代价函数,同时保证其他代价函数小于给定上界的最优控制律。等周约束的引入为描述复杂的控制目标提供了极大的便利,因而在工程应用中十分常见。然而,相较于经典的控制约束最优控制问题,等周约束是关于整个时域上的状态量和控制量的总和的约束,因而它破坏了最优控制问题的无后效性,阻碍了动态规划方法的顺利应用,增大了问题的求解难度。因此,对于等周约束最优控制问题的研究具有极大的应用潜力和重要的理论价值。

针对实际系统,在建立最优控制问题时,其中的约束条件往往隐含在专家经验中,且严重依赖于专家的手工设计。另一方面,等周约束具有应用广泛、易于参数化、表达能力强的特点,这使其在提取潜在复杂约束方面具有强大的潜力。等周约束逆最优控制旨在根据给定的最优状态和控制轨迹,将潜在复杂约束自动提取为等周约束的形式,从而帮助专家设计最优控制问题中的约束条件,减少人力消耗。等周约束逆最优控制具有广泛的应用前景,不仅有助于等周约束最优控制问题的建立,而且有助于分析并改善使系统性能降低的约束。

本文以自适应动态规划理论为基础,研究等周约束最优控制问题及其逆问题的求解方法。等周约束最优控制问题上的研究成果有助于对其逆问题的研究,同时,等周约束逆最优控制问题的研究结果也便于正向最优控制问题的建立。本文的主要工作和创新点归纳如下:

1. 针对离散时间非线性系统在无穷时域上的等周约束最优控制问题,提出了等周约束值迭代方法。在已知某个可行控制律的条件下,构造非线性控制约束条件,从而使用带控制约束的最优控制问题近似原等周约束最优控制问题,并估计近似前后的误差。在此基础上,提出了等周约束值迭代算法求解转化后的最优控制问题,证明了迭代值函数收敛至等周约束Bellman方程的解,并证明了迭代控制律的可行性。进一步地,给出了基于神经网络的算法实施方案,并在考虑神经网络近似误差的条件下证明了算法的收敛性和近似控制律的可行性。

2. 针对离散时间非线性系统在无穷时域上的等周约束最优控制问题,提出了等周约束多步前瞻策略迭代方法。在等周约束值迭代算法的基础上,放松已知可行初始控制律的条件,转而通过构造辅助函数将等周约束最优控制问题转化为控制约束最优控制问题,并给出辅助函数的构造方法。在此基础上,提出等周约束多步前瞻策略迭代方法近似求解等周约束最优控制问题,并证明算法的收敛性和最优性。进一步地,给出了基于函数近似的算法实施方案,并在考虑近似误差的条件下分析了算法的误差界,从而给出了保证迭代值函数收敛至最优值函数的有限邻域内的充分条件。

3. 针对连续时间非线性系统在有限时域上的等周约束最优控制问题,提出了原-对偶自适应动态规划方法,将非线性等周约束最优控制问题拆分为一系列可由原-对偶方法求解的线性二次时变等周约束最优控制问题,并证明了原-对偶自适应动态规划方法的收敛性。进一步地,基于Pontryagin原理推导了最优性必要条件,并证明了迭代极限值满足最优性必要条件,从而分析了原-对偶自适应动态规划方法的最优性。

4. 针对离散时间非线性等周约束逆最优控制问题,提出了等周约束推理方法。通过推导等周约束最优控制问题的最优性必要条件并参数化约束函数,基于给定轨迹数据建立了关于未知等周约束的非线性恢复方程组。
在此基础上,给出恢复方程组解的唯一性成立的充分条件。当该非线性方程组具有唯一解时,给出解析的求解公式,否则通过求解带约束优化问题推理约束。进一步地,将该逆最优控制方法扩展到终端状态不受约束的场景和给定多条示例轨迹的场景中。

语种中文
页码158
内容类型学位论文
源URL[http://ir.ia.ac.cn/handle/173211/56621]  
专题毕业生_博士学位论文
通讯作者李涛
推荐引用方式
GB/T 7714
李涛. 等周约束最优控制问题及其逆问题研究[D]. 2024.
个性服务
查看访问统计
相关权益政策
暂无数据
收藏/分享
所有评论 (0)
暂无评论
 

除非特别说明,本系统中所有内容都受版权保护,并保留所有权利。


©版权所有 ©2017 CSpace - Powered by CSpace