设为首页
收藏本站
切换到窄版
地模论坛
BBS
登录
立即注册
地模论坛
»
地模论坛
›
高性能计算相关
›
高性能计算
›
《Mathematical Foundations of Reinforcement Learning ...
返回列表
发布新帖
查看:
17
|
回复:
0
《Mathematical Foundations of Reinforcement Learning》(强化学习数学基础)
论坛搬运工
论坛搬运工
当前离线
积分
536
141
主题
16
回帖
536
积分
高级会员
高级会员, 积分 536, 距离下一级还需 464 积分
高级会员, 积分 536, 距离下一级还需 464 积分
积分
536
发消息
发表于 2025-3-11 16:25:25
|
查看全部
|
阅读模式
清华大学出版的强化学习(Reinforcement Learning, RL)教材,目前已在GitHub上揽获6K+ Star!
这本书名为《Mathematical Foundations of Reinforcement Learning》(强化学习数学基础),系统性强,内容循序渐进,并配有「视频」讲解,适合不同层次的学习者。
书中从最基本的概念讲起,如状态、动作、回报、价值函数等。
并逐步深入到更高级的算法,包括蒙特卡洛方法、时序差分学习(如Q-learning和Sarsa)、策略梯度方法(如REINFORCE),以及深度Q网络(DQN)等。
除了完整数学推导,还特别优化了讲解方式,力求基础友好但不失深度。
令人惊喜的是,该书的配套视频课程也已上线,完整内容涵盖:
- 30分钟强化学习综述
- 强化学习的基本概念(状态、动作、策略、奖励等)
- Bellman方程及最优性方程推导
- 价值迭代、策略迭代、蒙特卡洛方法、时序差分学习(TD-learning)
- 深度Q网络(DQN)、策略梯度方法(PG)、深度强化学习(Deep RL)
视频课程不仅是书籍的补充,还能帮助学习者更直观地理解数学概念,并将其转化为实际应用。
此外,所有代码和学习笔记均已开源,其中不乏Python、R、C++等多种语言的实现,许多业内大佬也贡献了高质量代码。
值得一提的是,本书作者是赵世钰,他本硕毕业于北京航空航天大学,博士毕业于新加坡国立大学,入选斯坦福全球前2%顶尖科学家,曾获“关肇直奖”。
目前,他是西湖大学工学院特聘研究员、智能无人系统实验室负责人,并担任中国自动化学会TCCT专委会委员、人工智能学会智能决策专委会委员等职务。
请点击:
https://github.com/MathFoundatio ... nforcement-Learning
来源: 微博 @量子位
回复
举报
返回列表
发布新帖
高级模式
B
Color
Image
Link
Quote
Code
Smilies
您需要登录后才可以回帖
登录
|
立即注册
本版积分规则
发表回复
回帖后跳转到最后一页
地模论坛
© 2001-2025
Discuz! Team
. Powered by
Discuz!
W1.5
京ICP备14024088号
关灯
在本版发帖
返回顶部
快速回复
返回顶部
返回列表