Home

Welcome to the reinforcement_learning wiki!

What's in this repository?

This repository contains codes that I have reproduced for various reinforcement learning algorithms. The codes were tested on Colab.

Implemented Algorithms

Algorithms	Discrete	Continuous	Multithreaded	Multiprocessing	Tested on
DQN	✔️				CartPole-v0
Double DQN (DDQN)	✔️				CartPole-v0
Dueling DDQN	✔️				CartPole-v0
Dueling DDQN + PER	✔️				CartPole-v0
A3C ⁽¹⁾	✔️	✔️	✔️	✔️⁽³⁾	CartPole-v0, Pendulum-v0
DPPO ⁽²⁾		✔️		✔️⁽³⁾	Pendulum-v0
RND + PPO		✔️			MountainCarContinuous-v0

^{^{(1): N-step returns used for critic's target.}}
^{^{(1): GAE used for computation of TD lambda return (for critic's target) & policy's advantage.}}
^{^{(3): Distributed Tensorflow & Python's multiprocessing package used.}}

Blog

Check out my blog for more information on my repositories.

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Home

What's in this repository?

Implemented Algorithms

Blog

Clone this wiki locally