设为首页
收藏本站
切换到窄版
地模论坛
BBS
登录
立即注册
地模论坛
»
地模论坛
›
高性能计算相关
›
高性能计算
›
《Mathematical Foundations of Reinforcement Learning ...
返回列表
发布新帖
查看:
586
|
回复:
0
《Mathematical Foundations of Reinforcement Learning》(强化学习数学基础)
[复制链接]
论坛搬运工
论坛搬运工
当前离线
积分
1396
347
主题
48
回帖
1396
积分
金牌会员
金牌会员, 积分 1396, 距离下一级还需 1604 积分
金牌会员, 积分 1396, 距离下一级还需 1604 积分
积分
1396
发消息
发表于 2025-3-11 16:25:25
|
查看全部
|
阅读模式
清华大学出版的强化学习(Reinforcement Learning, RL)教材,目前已在GitHub上揽获6K+ Star!
这本书名为《Mathematical Foundations of Reinforcement Learning》(强化学习数学基础),系统性强,内容循序渐进,并配有「视频」讲解,适合不同层次的学习者。
书中从最基本的概念讲起,如状态、动作、回报、价值函数等。
并逐步深入到更高级的算法,包括蒙特卡洛方法、时序差分学习(如Q-learning和Sarsa)、策略梯度方法(如REINFORCE),以及深度Q网络(DQN)等。
除了完整数学推导,还特别优化了讲解方式,力求基础友好但不失深度。
令人惊喜的是,该书的配套视频课程也已上线,完整内容涵盖:
- 30分钟强化学习综述
- 强化学习的基本概念(状态、动作、策略、奖励等)
- Bellman方程及最优性方程推导
- 价值迭代、策略迭代、蒙特卡洛方法、时序差分学习(TD-learning)
- 深度Q网络(DQN)、策略梯度方法(PG)、深度强化学习(Deep RL)
视频课程不仅是书籍的补充,还能帮助学习者更直观地理解数学概念,并将其转化为实际应用。
此外,所有代码和学习笔记均已开源,其中不乏Python、R、C++等多种语言的实现,许多业内大佬也贡献了高质量代码。
值得一提的是,本书作者是赵世钰,他本硕毕业于北京航空航天大学,博士毕业于新加坡国立大学,入选斯坦福全球前2%顶尖科学家,曾获“关肇直奖”。
目前,他是西湖大学工学院特聘研究员、智能无人系统实验室负责人,并担任中国自动化学会TCCT专委会委员、人工智能学会智能决策专委会委员等职务。
请点击:
https://github.com/MathFoundatio ... nforcement-Learning
来源: 微博 @量子位
回复
举报
返回列表
发布新帖
高级模式
B
Color
Image
Link
Quote
Code
Smilies
您需要登录后才可以回帖
登录
|
立即注册
本版积分规则
发表回复
回帖后跳转到最后一页
地模论坛
© 2001-2025
Discuz! Team
. Powered by
Discuz!
W1.5
京ICP备14024088号
关灯
在本版发帖
返回顶部
快速回复
返回顶部
返回列表