#

dyna-q

Here are 18 public repositories matching this topic...

Senich17 / Dyna-Q-in-a-deterministic-and-stochastic-env

Experiments with Dyna-Q

reinforcement-learning rl gym-environment dyna-q gymnasium-environment

Updated Jul 29, 2024
Jupyter Notebook

grahamdavies15 / RaceTrackDoubleDynaQ

Reinforcement Learning: Modification of Q-learning through the use DynaQ learning and Double-Q learning.

reinforcement-learning dyna-q double-q-learning

Updated Jun 4, 2024
Python

moripiri / Reinforcement-Learning-on-FrozenLake

Reinforcement Learning Algorithms in a simple Gridworld

reinforcement-learning monte-carlo openai-gym q-learning reinforcement-learning-algorithms sarsa reinforce policy-iteration value-iteration td-learning actor-critic sarsa-lambda frozenlake frozenlake-v0 dyna-q sutton-gridworld monte-carlo-control sutton-barto-book

Updated May 8, 2024
Jupyter Notebook

zaid-24 / The-RL-Agent

path planning using Q learning algorithm

reinforcement-learning qlearning-algorithm gridworld-environment dyna-q sarsa-algorithm

Updated Oct 12, 2023
Python

nslyubaykin / relax

ReLAx - Reinforcement Learning Applications Library

dqn ddpg sac trpo categorical-dqn ppo model-based-rl dyna-q reinforcementlearning td3 policy-gradients rainbow-dqn n-step-bootstrapping mbpo

Updated Feb 19, 2023
Python

luke-davidson / ReinforcementLearning

Programming assignments completed for my Reinforcement Learning course: Topics include Bandit Algorithms, Dynamic Programming, policy iteration, Monte-Carlo methods, SARSA, Q-Learning, Dyna-Q/Dyna-Q+, gradient control methods, state aggregation methods, and Deep Q-Learning Networks (DQNs).

reinforcement-learning deep-learning monte-carlo deep-reinforcement-learning q-learning policy-gradient dynamic-programming deep-q-network policy-iteration gradient-descent-algorithm bandit-algorithms sarsa-learning dyna-q

Updated Jan 28, 2023
Jupyter Notebook

nslyubaykin / relax_dyna_q_example

Example DYNA-Q implementation with ReLAx

reinforcement-learning reinforcement-learning-algorithms continuous-control dyna-q model-based-reinforcement-learning td3 model-based-acceleration

Updated Aug 29, 2022
Jupyter Notebook

dksifoua / Reinforcement-Learning

reinforcement-learning monte-carlo q-learning policy-gradient sarsa dynamic-programming reinforce markov-decision-processes actor-critic asynchronous-advantage-actor-critic proximal-policy-optimization advantage-actor-critic dyna-q temporal-difference

Updated May 3, 2024
Jupyter Notebook

reinforcement-learning-specialization

imimali / reinforcement-learning-specialization

Reinforcement Learning Specialization courses solutions

reinforcement-learning neural-network monte-carlo q-learning policy-gradient sarsa markov-decision-processes temporal-differencing-learning dyna-q

Updated Feb 2, 2022
Jupyter Notebook

gabrielegilardi / Q-Learning

Reinforcement Learning Using Q-learning, Double Q-learning, and Dyna-Q.

python reinforcement-learning q-learning gridworld transition-matrix probabilistic-model dyna-q deterministic-model

Updated Oct 27, 2021
Python

Atul-Acharya-17 / Markov-Decision-Process

Solving Markov Decision Process using Value Iteration and Policy Iteration, SARSA, Expected SARSA and Q-Learning

q-learning markov-decision-processes policy-iteration value-iteration expected-sarsa sarsa-learning dyna-q

Updated Oct 20, 2021
Jupyter Notebook

aylint / rl-algorithms

Various fundamental reinforcement learning algorithms implemented from scratch

python reinforcement-learning q-learning reinforcement-learning-algorithms sarsa expected-sarsa temporal-differencing-learning dyna-q prioritized-sweeping

Updated May 26, 2020
Python

adesgautam / Reinforcement-Learning

Reinforcement learning algorithms to solve OpenAI gym environments

reinforcement-learning openai-gym q-learning dqn cartpole mountain-car sarsa taxi openai-gym-environments frozenlake dyna-q

Updated May 16, 2020
Python

adik993 / reinforcement-learning-sutton

reinforcement-learning q-learning sarsa gridworld multi-armed-bandits random-walk racecar bandit-algorithm sutton-book td-lambda dyna-q cliffwalking

Updated Mar 4, 2020
Python

netrookiecn / Reinforcement-Learning-For-Dialogue-Systems

Reinforcement Learning For Dialogue Systems 强化学习在对话系统中的应用论文或开源应用总结

reinforcement-learning dqn dialogue-systems ppo a2c dyna-q dialogue-policy d3q

Updated Dec 27, 2019

kkhetarpal / COMP767

Assignments and Reading Material for RL Course

learning planning function-approximation dyna-q lstdlambda

Updated Mar 28, 2018
Jupyter Notebook

txzhao / rl-zoo

PyTorch implementation of various reinforcement learning algorithms

dqn reinforcement-learning-algorithms double-dqn pytorch-rl prioritized-experience-replay dyna-q

Updated Feb 22, 2018
Python

jpthanga / Dyna-Q-on-Grid-World

Implementation of Dyna-Q with priority sweeping on a basic n by n gridworld

reinforcement-learning cpp dyna-q rlglue

Updated Jan 15, 2018
C

Improve this page

Add a description, image, and links to the dyna-q topic page so that developers can more easily learn about it.

Curate this topic

Add this topic to your repo

To associate your repository with the dyna-q topic, visit your repo's landing page and select "manage topics."