Skip to content

Commit 256710d

Browse files
authored
update README.md
1 parent 988601e commit 256710d

1 file changed

Lines changed: 2 additions & 2 deletions

File tree

README.md

Lines changed: 2 additions & 2 deletions
Original file line numberDiff line numberDiff line change
@@ -6,7 +6,7 @@
66

77
## 🎯 笔记介绍
88

9-
  本笔记是对赵世钰老师所著《强化学习中的数学原理》的个人思考与总结。在此基础上,我还补充了对书中核心算法的实现,以便读者能获得更直观的理解。书中首先从基础概念入手,讲解Bellman公式和Bellman最优公式,接着扩展到基于模型(model-based)和无模型(model-free)的强化学习算法,最终推广到基于函数逼近的强化学习算法。若读者在强化学习方面没有背景知识,只需具备一定的线性代数和概率论基础即可阅读本书。而对于已有一些强化学习知识的读者,本笔记则可以帮助他们深入理解相关问题。
9+
  本笔记是对赵世钰老师所著《强化学习中的数学原理》的个人思考与总结,笔者将其做成了网页模式,方便大家随时随地在掌上设备阅读。在此基础上,我还补充了对书中核心算法的实现,以便读者能获得更直观的理解。书中首先从基础概念入手,讲解Bellman公式和Bellman最优公式,接着扩展到基于模型(model-based)和无模型(model-free)的强化学习算法,最终推广到基于函数逼近的强化学习算法。若读者在强化学习方面没有背景知识,只需具备一定的线性代数和概率论基础即可阅读本书。而对于已有一些强化学习知识的读者,本笔记则可以帮助他们深入理解相关问题。
1010

1111
## 📖 内容导航
1212

@@ -33,5 +33,5 @@
3333

3434
如果你对强化学习感兴趣,可以参与到该笔记的完善中!❤️
3535

36-
- 💡 **内容完善** - 帮助改进笔记内容
36+
- 💡**内容完善** - 帮助改进笔记内容
3737
- 📝**报告问题** - 发现问题请提交 Issue

0 commit comments

Comments
 (0)