3788| 0
|
多智能体机器学习:强化学习方法 [加]霍华德 M.施瓦兹著 连晓峰等译 |
多智能体机器学习:强化学习方法 [加]霍华德 M.施瓦兹著 连晓峰等译
出版社:机械工业出版社 2018年5月 本书主要介绍了多智能体机器人强化学习的相关内容。全书共6章,首先介绍了几种常用的监督式学习方法,在此基础上,介绍了单智能体强化学习中的学习结构、值函数、马尔科夫决策过程、策略迭代、时间差分学习、Q学习和资格迹等概念和方法。然后,介绍了双人矩阵博弈问题、多人随机博弈学习问题,并通过3种博弈游戏详细介绍了纳什均衡、学习算法、学习自动机、滞后锚算法等内容,并提出LR-I滞后锚算法和指数移动平均Q学习算法等,并进行了分析比较。接下来,介绍了模糊系统和模糊学习,并通过仿真示例详细分析算法。后,介绍了群智能学习进化以及性格特征概念和应用。全书内容丰富,重点突出。 目录 译者序 原书前言 第1章监督式学习概述 1.1LS算法 1.2RLS算法 1.3LMS算法 1.4随机逼近法 参考文献 第2章单智能体强化学习 2.1简介 2.2n臂赌博机问题 2.3学习结构 2.4值函数 2.5最优值函数 2.5.1网格示例 2.6.MDP 2.7学习值函数 2.8策略迭代 2.9时间差分学习 2.10状态一行为函数的时间差分学习 2.11Q学习 2.12资格迹 参考文献 第3章双人矩阵博弈学习 3.1矩阵博弈 3.2双人矩阵博弈中的纳什均衡 3.3双人零和矩阵博弈中的线性规划 3.4学习算法 3.5梯度上升算法 3.6WoLF.-.IGA算法 3.7PHC算法 3.8WoLF.-.PHC算法 3.9矩阵博弈中的分散式学习 3.10学习自动机 3.11线性回报一无为算法 3.12线性回报一惩罚算法 3.13滞后锚算法 3.14LR.滞后锚算法 ……………… 链接: https://pan.baidu.com/s/1f5kqtJSNGEN0oETOz0DbqA
购买主题
本主题需向作者支付 20 机械币 才能浏览
| |
手机版|小黑屋|机械村 ( 渝ICP备17010994号-1|渝公网安备50022702001048号 )
GMT+8, 2024-11-24 06:35 , Processed in 0.080411 second(s), 7 queries , Gzip On, Redis On.
Powered by 机械村
Copyright © 2012- Jixiecun.com