ELEC-E8125 Reinforcement Learning - Final Project

Part 1

Implementation of Twin Delayed Deep Deterministic Policy Gradient (TD3) and Proximal Policy Optimization (PPO) for continuous control tasks in the InvertedPendulumBulletEnv-v0 and HalfCheetahBulletEnv-v0 environments.

Part 2

Implementation of TD3 with behavioral cloning (TD3+BC) for offline reinforcement learning.

Name		Name	Last commit message	Last commit date
Latest commit History 9 Commits
part1		part1
part2		part2
README.md		README.md
requirements.txt		requirements.txt

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

ELEC-E8125 Reinforcement Learning - Final Project

Part 1

Part 2

About

Releases

Packages

Contributors 2

Languages

spetravic/Reinforcement_Learning-Project

Folders and files

Latest commit

History

Repository files navigation

ELEC-E8125 Reinforcement Learning - Final Project

Part 1

Part 2

About

Topics

Resources

Stars

Watchers

Forks

Releases

Packages 0

Contributors 2

Languages

Packages