# rl_learn

**Repository Path**: Lighters_c/rl_learn

## Basic Information

- **Project Name**: rl_learn
- **Description**: No description available
- **Primary Language**: Unknown
- **License**: LGPL-3.0
- **Default Branch**: master
- **Homepage**: None
- **GVP Project**: No

## Statistics

- **Stars**: 0
- **Forks**: 0
- **Created**: 2021-05-18
- **Last Updated**: 2021-05-26

## Categories & Tags

**Categories**: Uncategorized

**Tags**: None

## README

# 强化学习学习

docs目录下为公式推导证明的手写PDF

env为实现的gym环境

reference下为参考的一些网上的代码

### 5-26

值迭代和策略迭代用模板改了改，为了和模板衔接修改了点环境的代码，比如模板里面的状态是从0开始的……

一开始没想到这蛋疼的情况，导致了代码变得丑陋……

俩算法放在rl_algorithm/dp目录下，参考的jupyter notebook文件放在reference/algorithm/dp里面