电子书地址: http://incompleteideas.net/book/RLbook2020.pdf
这是一本行业公认入门教科书。作为机器学习的初学者们,我们学完Transformer大语言模型之后,群里决定通过读书与代码实践方式一起来补一下强化学习的基础。正赶上o1发布,基于强化学习的CoT的思维方式,我们可以更好的理解强化学习的应用方向。
每一个目录对应了每一章中的内容,包括了书中的代码实现与个人理解的笔记。我争取在每一章的代码实现中,都加入了一些自己的理解,以及后期通过动手的例子来解释概念。这样可以更好的理解强化学习中的概念与应用。
最佳方式是对应我录的视频来看这里的代码,这样可以更好的理解书中的例子。
可以在各个平台找到我的视频录播地址:
部分代码修改自: