《Mathematical Foundations of Reinforcement Learning》（强化学习数学基础）

论坛搬运工 · 发表于 2025-3-11 16:25:25

清华大学出版的强化学习（Reinforcement Learning, RL）教材，目前已在GitHub上揽获6K+ Star！

这本书名为《Mathematical Foundations of Reinforcement Learning》（强化学习数学基础），系统性强，内容循序渐进，并配有「视频」讲解，适合不同层次的学习者。

书中从最基本的概念讲起，如状态、动作、回报、价值函数等。

并逐步深入到更高级的算法，包括蒙特卡洛方法、时序差分学习（如Q-learning和Sarsa）、策略梯度方法（如REINFORCE），以及深度Q网络（DQN）等。

除了完整数学推导，还特别优化了讲解方式，力求基础友好但不失深度。

令人惊喜的是，该书的配套视频课程也已上线，完整内容涵盖：

- 30分钟强化学习综述
- 强化学习的基本概念（状态、动作、策略、奖励等）
- Bellman方程及最优性方程推导
- 价值迭代、策略迭代、蒙特卡洛方法、时序差分学习（TD-learning）
- 深度Q网络（DQN）、策略梯度方法（PG）、深度强化学习（Deep RL）

视频课程不仅是书籍的补充，还能帮助学习者更直观地理解数学概念，并将其转化为实际应用。

此外，所有代码和学习笔记均已开源，其中不乏Python、R、C++等多种语言的实现，许多业内大佬也贡献了高质量代码。

值得一提的是，本书作者是赵世钰，他本硕毕业于北京航空航天大学，博士毕业于新加坡国立大学，入选斯坦福全球前2%顶尖科学家，曾获“关肇直奖”。

目前，他是西湖大学工学院特聘研究员、智能无人系统实验室负责人，并担任中国自动化学会TCCT专委会委员、人工智能学会智能决策专委会委员等职务。

请点击：https://github.com/MathFoundatio ... nforcement-Learning

来源：微博 @量子位