小学资料: 一年级; 二年级; 三年级; 四年级; 五年级; 六年级; 小升初

初中资料: 初一; 初二; 初三; 中考

高中资料: 高一; 高二; 高三; 高考

课后答案: 补充习题; 练习与测试; 课课练; 同步练习; 其他习题

阅读训练: 阅读练习题; 古诗文鉴赏; 议论文阅读; 记叙文阅读; 说明文阅读; 应用文阅读

学习方法: 学习方法; 学习计划; 课堂听课; 复习方法

学科资料: 语文; 数学; 英语; 物理; 化学; 生物; 政治; 历史; 地理; 其它学科

范文文档: 工作总结; 工作计划; 工作报告; 心得体会; 论文大全; 名言句子; 文秘资料; 公文资料; 稿件大全; 评语大全; 祝福语大全; 观后感大全; 读后感大全; 节日庆典大全; 入团入党申请书; 经典范文

美文文档: 经典美文; 情感美文; 爱情美文; 哲理美文; 日记随笔; 励志故事; 语句摘抄; 经典语录; 签名说说; 微小说; 散文诗歌; 优美句子

作文文档: 小学作文; 初中作文; 高中作文; 优秀作文

教育文库: 幼儿教育; 小学教育; 初中教育; 教学研究; 专业资料; 资格考试; 教育文库; 外语考试; 高等教育; 求职职场; 高中教育; 实用文档

近似动态规划方法及其在交通中的应用(13)

时间：2025-07-11

北京交通大学博士学位论文

Ｒ（ｆ）

图１．３网络训练结构图【１４】

Ｆｉｇ．１．３ＮｅｔｗｏｒｋａｄａｐｔｉｏｎｉｎＤＨＰ

在ＤＨＰ中，

帮２郭”，，鬻＋嚣ｎ∥川，鬻攀

目。在式子（１．１３）中，每一个组成向量岛（ｆ）的分量在（１．１５）中定义。ｎ㈣其中，五（ｆ＋１）＝ａＪ（ｔ＋１）／ＯＲｉ（ｔ＋１），即，ｍ分别是模型和Ａｃｔｉｏｎ的输出量的数

钳，２拳一／可ａＪ（ｔ＋１）一事８Ｕ（ｔ）一ｘｋ＝１１硒８Ｕ（ｔ）攀

Ｉｌｉａｕ（ｔ）叫，塑娑１１挲８，４“）ａＡ（ｔ）ｌａ形。∽均基于动作依赖的ＤＨＰ（ＡＤＤＨＰ）方法假设了Ａｃｔｉｏｎ和Ｃｒｉｔｉｃ之间的直接连接。从图１．３我们可以看出，见＠＋１）通过Ｍｏｄｅｌ模块反向传播至Ａｃｔｉｏｎ模块。当采用最小均方算法（ＬｅａｓｔＭｅａｎＳｑｕａｒｅ，简称ＬＭＳ）调整Ａｃｔｉｏｎ模块权值时，公式如下：ＡＷ：７７

ａ。ａ（１．１６）、

而在ＧＤＨＰ（ＡＤＧＤＨＰ）方法ｒｆｌ，Ｃｒｉｔｉｃ模块通过同时估计，和甜／融使得误差最小化，虽然设计过程相对复杂，但能够获得较快的学习速度。

综上所述，近似动态规划采用Ａｃｔｉｏｎ模块和Ｃｒｉｔｉｃ模块交互的训练方式，训８

近似动态规划方法及其在交通中的应用(13).doc 将本文的Word文档下载到电脑

下载这篇word文档

上一篇：三(2)班校园安全日记

下一篇：2014年人教版小学四年级数学上册期中试卷(精选两

精彩图片

猜你喜欢

热门精选

经典双语美文：加油为了心中的梦想

美文赏析：花开向暖，素锦留香

经典美文：花开向暖，素锦留香

经典美文：青春如歌，携一份懂得同行

在雨中静听自己的心跳美文

浅谈当今大学教育的含金量双语美文

大家正在看

色彩—明度优良班风学风建设策划中试报告样本 L1 Cache and TLB Enhancements to the RAMp 浙江省衢州市2015年中考数学试题中考专题测试二次根式及一元二次工程质量保证措施及创优计划1 小学四年级英语第七单元试题