返回列表 发布新帖
查看: 17|回复: 0

《Mathematical Foundations of Reinforcement Learning》(强化学习数学基础)

141

主题

16

回帖

536

积分

高级会员

积分
536
发表于 2025-3-11 16:25:25 | 查看全部 |阅读模式
清华大学出版的强化学习(Reinforcement Learning, RL)教材,目前已在GitHub上揽获6K+ Star!

这本书名为《Mathematical Foundations of Reinforcement Learning》(强化学习数学基础),系统性强,内容循序渐进,并配有「视频」讲解,适合不同层次的学习者。

书中从最基本的概念讲起,如状态、动作、回报、价值函数等。

并逐步深入到更高级的算法,包括蒙特卡洛方法、时序差分学习(如Q-learning和Sarsa)、策略梯度方法(如REINFORCE),以及深度Q网络(DQN)等。

除了完整数学推导,还特别优化了讲解方式,力求基础友好但不失深度。

令人惊喜的是,该书的配套视频课程也已上线,完整内容涵盖:

- 30分钟强化学习综述
- 强化学习的基本概念(状态、动作、策略、奖励等)
- Bellman方程及最优性方程推导
- 价值迭代、策略迭代、蒙特卡洛方法、时序差分学习(TD-learning)
- 深度Q网络(DQN)、策略梯度方法(PG)、深度强化学习(Deep RL)

视频课程不仅是书籍的补充,还能帮助学习者更直观地理解数学概念,并将其转化为实际应用。

此外,所有代码和学习笔记均已开源,其中不乏Python、R、C++等多种语言的实现,许多业内大佬也贡献了高质量代码。

值得一提的是,本书作者是赵世钰,他本硕毕业于北京航空航天大学,博士毕业于新加坡国立大学,入选斯坦福全球前2%顶尖科学家,曾获“关肇直奖”。

目前,他是西湖大学工学院特聘研究员、智能无人系统实验室负责人,并担任中国自动化学会TCCT专委会委员、人工智能学会智能决策专委会委员等职务。

请点击:https://github.com/MathFoundatio ... nforcement-Learning

来源: 微博 @量子位

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

地模论坛 © 2001-2025 Discuz! Team. Powered by Discuz! W1.5 京ICP备14024088号
关灯 在本版发帖 返回顶部
快速回复 返回顶部 返回列表