多智能体机器学习：强化学习方法 [加]霍华德 M.施瓦兹著连晓峰等译

th4634821 · 发表于 2021-4-24 17:58:28

多智能体机器学习：强化学习方法 [加]霍华德 M.施瓦兹著连晓峰等译

出版社:机械工业出版社
2018年5月

本书主要介绍了多智能体机器人强化学习的相关内容。全书共6章，首先介绍了几种常用的监督式学习方法，在此基础上，介绍了单智能体强化学习中的学习结构、值函数、马尔科夫决策过程、策略迭代、时间差分学习、Q学习和资格迹等概念和方法。然后，介绍了双人矩阵博弈问题、多人随机博弈学习问题，并通过3种博弈游戏详细介绍了纳什均衡、学习算法、学习自动机、滞后锚算法等内容，并提出LR-I滞后锚算法和指数移动平均Q学习算法等，并进行了分析比较。接下来，介绍了模糊系统和模糊学习，并通过仿真示例详细分析算法。后，介绍了群智能学习进化以及性格特征概念和应用。全书内容丰富，重点突出。

目录
译者序
原书前言
第1章监督式学习概述
1.1LS算法
1.2RLS算法
1.3LMS算法
1.4随机逼近法
参考文献
第2章单智能体强化学习
2.1简介
2.2n臂赌博机问题
2.3学习结构
2.4值函数
2.5最优值函数
2.5.1网格示例
2.6.MDP
2.7学习值函数
2.8策略迭代
2.9时间差分学习
2.10状态一行为函数的时间差分学习
2.11Q学习
2.12资格迹
参考文献
第3章双人矩阵博弈学习
3.1矩阵博弈
3.2双人矩阵博弈中的纳什均衡
3.3双人零和矩阵博弈中的线性规划
3.4学习算法
3.5梯度上升算法
3.6WoLF.-.IGA算法
3.7PHC算法
3.8WoLF.-.PHC算法
3.9矩阵博弈中的分散式学习
3.10学习自动机
3.11线性回报一无为算法
3.12线性回报一惩罚算法
3.13滞后锚算法
3.14LR．滞后锚算法
………………

链接: https://pan.baidu.com/s/1f5kqtJSNGEN0oETOz0DbqA

购买主题本主题需向作者支付 20 机械币 才能浏览

		自动登录	找回密码
密码			立即注册

多智能体机器学习：强化学习方法 [加]霍华德 M.施瓦兹著 连晓峰等译

多智能体机器学习：强化学习方法 [加]霍华德 M.施瓦兹著连晓峰等译