PARL/examples/tutorials at develop · PaddlePaddle/PARL · GitHub

Name		Name	Last commit message	Last commit date
parent directory ..
homework		homework
lesson1		lesson1
lesson2		lesson2
lesson3/dqn		lesson3/dqn
lesson4/policy_gradient		lesson4/policy_gradient
lesson5/ddpg		lesson5/ddpg
parl2_dygraph		parl2_dygraph
README.md		README.md
requirements.txt		requirements.txt

README.md

《PARL强化学习入门实践》课程示例

针对强化学习初学者，PARL提供了入门课程，展示最基础的5个强化学习算法代码示例（注意：本课程示例均基于静态图框架编写）。

News:

[2021.12.06] 应广大学员的要求，我们提供了课程配套代码的（lesson3-lesson5）的动态图框架版本，见链接。lesson1-lesson2不涉及神经网络，可沿用本目录下的代码。

课程大纲

一、强化学习(RL)初印象
- RL概述、入门路线
- 实践：环境搭建（lesson1 的代码提供了格子环境世界的渲染封装）
二、基于表格型方法求解RL
- MDP、状态价值、Q表格
- 实践： Sarsa、Q-learning
三、基于神经网络方法求解RL
- 函数逼近方法
- 实践：DQN
四、基于策略梯度求解RL
- 策略近似、策略梯度
- 实践：Policy Gradient
五、连续动作空间上求解RL
- 实战：DDPG

使用说明

安装依赖（注意：请务必安装对应的版本）

Python 3.6/3.7
paddlepaddle==1.8.5
parl==1.3.1 或者 parl==1.4
gym==0.18.0
atari-py==0.2.6 (仅 lesson4 的 homework 需要安装)
rlschool==0.3.1 (仅 lesson5 的 homework 需要安装)

可以直接安装本目录下的 requirements.txt 来完成以上依赖版本的适配。

pip install -r requirements.txt

运行示例

进入每个示例对应的代码文件夹中，运行

python train.py