这是一个基于emoji可视化的网格世界(gridworld)强化学习示例代码,目前已完成至第七章
并且同步附有bilibili网站的视频代码讲解,欢迎各位同学参与到讨论学习当中
欢迎各位同学加群一起讨论583867967(已有107人) 3.15是22人
项目对应B站链接:https://www.bilibili.com/video/BV1fW421w7NH
该项目为西湖大学赵世钰老师的课程学习代码
课程的B站链接:【强化学习的数学原理】课程:从零开始到透彻理解(完结)_哔哩哔哩_bilibili
目前该代码只完成到前7课,正在编码第8课值函数近似。预计未来一到两周内学完。届时在B站中将发一个视频进行代码介绍。
B站视频已更新到第七章,第八章真的坑,天坑,这一章的代码我写了近一个月都收敛不了。 停更一段时间,一方面要准备考研复试,换个思路攻克一下第八章DQN不收敛的难题。
考研以上岸,B站视频已更新到第八章,准备开始第九章的学习,争取一周内攻克第九章第十章