近似动态规划方法及其在交通中的应用(6)
发布时间:2021-06-06
发布时间:2021-06-06
l绪论
1绪论
1.1引言
在现代科学技术领域中,自动控制技术发挥着越来越重要的作用,在航空航天、导航制导、工业控制、交通管理、生物医学、经济管理等众多社会生活领域中已成为不可或缺的重要组成部分。在工程实际应用中,由于控制目标和对象实际输出之间的误差是容易获取的,因而基于误差来消除误差的原形PID控制器在工业控制中得到了广泛的应用。但随着科学技术的发展,复杂工业过程普遍存在着不确定、多变量强耦合、强非线性、纯滞后、状态不完全可测、运行工况变化频繁等特性,而且大的干扰还经常发生,对付这样的被控对象,PID控制器就显得无能为力了。由此人们企图采用现代控制理论来解决这些问题,在现代控制理论方法中,数学模型的建立是分析和设计控制系统的前提,由于控制对象的复杂性,无法建立起精确的数学模型描述实际控制对象的所有细节,所以在实际建模时,必须在模型简化与分析结果的准确性之间做出适当折中,从而导致建立的模型无法反映系统的伞部动态特性,制约了控制系统品质的进一步提高。
为了解决经典控制理论和现代控制理论巾存在的问题,人们除了加强对生产过程的建模、系统辨识、自适应控制、智能控制、神经网络控制等研究外,开始寻找各种对模型要求低、在线计算方便、控制综合效果好的新的控制理论和方法。与此同时,计算机技术的飞速发展,使得高速、大容量、低成本的计算机应用越来越广泛,也为新的控制理论和方法提供了可实现的重要基础。近似动态规划fApproximateDynamicProgramming,简称ADP)是一种融合动态规划、强化学习、神经网络的近似最优控制方法,它根据环境反馈的评价信号来获取近似的最优控制策略,不依赖于被控对象精确的解析模型,能够在线调整控制参数,适用于复杂系统的实时最优控制,其基本思想就是通过评价网络来估计预先定义的性能指标函数来避免每个阶段内针对所有状态和控制变量进行精确计算,在一定程度上避免经典动态规划“维数灾"问题,并能在给定的性能指标下获得次优(近似最优)策略。综上所述,研究近似动态规划理论具有重大的理论意义和巨大的应用价值。
上一篇:三(2)班校园安全日记