Name		Name	Last commit message	Last commit date
Latest commit History 11 Commits
A2C		A2C
A3C		A3C
DDPG		DDPG
PPO		PPO
PPO_logs/BipedalWalker-v2		PPO_logs/BipedalWalker-v2
PPO_preTrained/BipedalWalker-v2		PPO_preTrained/BipedalWalker-v2
SAC		SAC
TD3		TD3
preTrained/BipedalWalker-v2		preTrained/BipedalWalker-v2
reference		reference
.gitignore		.gitignore
LICENSE		LICENSE
README.md		README.md
log.txt		log.txt
plot.py		plot.py

Repository files navigation

经典RL算法

算法	类型	确定性	离散	连续	使用体验
Nature DQN	VB \| off-policy	No	Yes	No	toy model，没人用
Double DQN	VB \| off-policy	No	Yes	No	to do
Dueling DQN	VB \| off-policy	No	Yes	No	to do
Rainbow DQN	TODO	No	Yes	No	to do
A2C	PG \| on-policy	No	Yes	Yes	评价是，不如 PPO
A3C	PG \| on-policy	No	Yes	Yes	多进程并行，硬件设备要求高
DDPG	PG \| off-policy	Yes	Yes	Yes	评价是，不如 TD3
TD3	PG \| off-policy	Yes	Yes	Yes	训练慢，难调参
PPO	PG \| on-policy	No	Yes	Yes	训练快，好调参，效果好
SAC	PG \| off-policy	No	Yes	Yes	可能比TD3还难训

Reference：

spinningup/spinup/algos/pytorch

higgsfield/RL-Adventure-2

easy-rl/projects/codes

Official TD3 Code

About

No description, website, or topics provided.

Apache-2.0 license

Report repository

Releases

No releases published

Packages

No packages published

Languages