# rl_learn **Repository Path**: Lighters_c/rl_learn ## Basic Information - **Project Name**: rl_learn - **Description**: No description available - **Primary Language**: Unknown - **License**: LGPL-3.0 - **Default Branch**: master - **Homepage**: None - **GVP Project**: No ## Statistics - **Stars**: 0 - **Forks**: 0 - **Created**: 2021-05-18 - **Last Updated**: 2021-05-26 ## Categories & Tags **Categories**: Uncategorized **Tags**: None ## README # 强化学习学习 docs目录下为公式推导证明的手写PDF env为实现的gym环境 reference下为参考的一些网上的代码 ### 5-26 值迭代和策略迭代用模板改了改,为了和模板衔接修改了点环境的代码,比如模板里面的状态是从0开始的…… 一开始没想到这蛋疼的情况,导致了代码变得丑陋…… 俩算法放在rl_algorithm/dp目录下,参考的jupyter notebook文件放在reference/algorithm/dp里面