Project Name | Rainbow | DQN | A2C | ACER | ACKTR | DDPG | GAIL | HER | PPO | TRPO |
---|---|---|---|---|---|---|---|---|---|---|
dopamine | √ | √ | ||||||||
baselines | √ | √ | √ | √ | √ | √ | √ | √ | √ | |
RL w/ TF | √ | √ | √ | √ | ||||||
TensorForce | √ | √ | √ | |||||||
rllab | √ | |||||||||
trfl | √ | √ | √ | |||||||
drl | √ | x | x | |||||||
spinningup | √ | √ | √ | |||||||
RL-Adventure-2 | √ | √ | √ | √ | √ | √ | ||||
Horizon | √ | √ | ||||||||
PT-a2c-ppo-acktr | √ | √ | √ | |||||||
DeepRL | √ | √ | √ | √ | ||||||
coach | √ | √ | √ | √ | √ | |||||
noreward-rl | ||||||||||
scalable-agent | ||||||||||
stable-baselines | √ | √ | √ | √ | √ | √ | √ | √ | √ | |
SLM-Lab | √ | √ | √ | |||||||
RND | ||||||||||
large curiosity | ||||||||||
rlkit | √ | √ | ||||||||
reaver-pysc2 | √ | √ | ||||||||
lagom | √ | √ | √ | √ | √ | √ | ||||
robotics-rl-srl | √ | √ | √ | √ | √ | √ | √ | |||
vel | √ | √ | √ | √ | √ | √ | ||||
pytorch-rl | x | √ | x | √ | √ | √ | ||||
garage | √ | √ | √ | |||||||
ptan | √ | √ | √ | √ | √ | |||||
anyrl-py | √ | √ | √ | |||||||
torch-rl | √ | |||||||||
rlgraph | √ | √ | √ |
Project Name | Sarsa | DDQN | Dueling DQN | VPG | RND | ICM | A3C | PER | NAFs |
---|---|---|---|---|---|---|---|---|---|
dopamine | √ | ||||||||
baselines | √ | ||||||||
RL w/ TF | √ | √ | √ | √ | √ | √ | √ | √ | |
TensorForce | √ | √ | √ | √ | |||||
rllab | √ | ||||||||
trfl | √ | √ | √ | ||||||
drl | √ | ||||||||
spinningup | √ | ||||||||
RL-Adventure-2 | |||||||||
Horizon | √ | √ | |||||||
PT-a2c-ppo-acktr | |||||||||
DeepRL | √ | √ | |||||||
coach | √ | √ | √ | √ | √ | √ | |||
noreward-rl | √ | ||||||||
scalable-agent | |||||||||
stable-baselines | |||||||||
SLM-Lab | √ | √ | √ | √ | √ | ||||
RND | √ | ||||||||
large curiosity | √ | ||||||||
rlkit | √ | ||||||||
reaver-pysc2 | |||||||||
lagom | √ | ||||||||
robotics-rl-srl | |||||||||
vel | √ | √ | √ | √ | |||||
pytorch-rl | √ | x | √ | ||||||
garage | √ | ||||||||
ptan | √ | √ | √ | √ | √ | ||||
anyrl-py | |||||||||
torch-rl | √ | ||||||||
rlgraph | √ | √ | √ | √ | √ |
Project Name | DQFD | TNPG | CMA ES | CEM | REPS | RWR | TD | DP | MC | SAC | TD3 | C51 |
---|---|---|---|---|---|---|---|---|---|---|---|---|
dopamine | √ | |||||||||||
baselines | ||||||||||||
RL w/ TF | ||||||||||||
TensorForce | √ | |||||||||||
rllab | √ | √ | √ | √ | √ | |||||||
trfl | √ | √ | ||||||||||
drl | √ | √ | √ | √ | ||||||||
spinningup | √ | √ | ||||||||||
RL-Adventure-2 | √ | √ | ||||||||||
Horizon | √ | |||||||||||
PT-a2c-ppo-acktr | ||||||||||||
DeepRL | √ | |||||||||||
coach | √ | √ | ||||||||||
noreward-rl | ||||||||||||
scalable-agent | ||||||||||||
stable-baselines | ||||||||||||
SLM-Lab | ||||||||||||
RND | ||||||||||||
large curiosity | ||||||||||||
rlkit | √ | √ | √ | |||||||||
reaver-pysc2 | ||||||||||||
lagom | ||||||||||||
robotics-rl-srl | √ | √ | ||||||||||
vel | ||||||||||||
pytorch-rl | √ | √ | ||||||||||
garage | √ | √ | √ | √ | √ | |||||||
ptan | √ | √ | ||||||||||
anyrl-py | ||||||||||||
torch-rl | ||||||||||||
rlgraph | √ |
Project Name | Q-learning | N-step DQN | Actor-Critic | IMPALA | ApeX |
---|---|---|---|---|---|
dopamine | |||||
baselines | |||||
RL w/ TF | √ | √ | |||
TensorForce | √ | √ | |||
rllab | |||||
trfl | √ | ||||
drl | |||||
spinningup | |||||
RL-Adventure-2 | |||||
Horizon | |||||
PT-a2c-ppo-acktr | |||||
DeepRL | √ | ||||
coach | √ | ||||
noreward-rl | |||||
scalable-agent | √ | ||||
stable-baselines | |||||
SLM-Lab | √ | ||||
RND | |||||
large curiosity | |||||
rlkit | |||||
reaver-pysc2 | |||||
lagom | √ | ||||
robotics-rl-srl | |||||
vel | |||||
pytorch-rl | |||||
garage | |||||
ptan | √ | √ | |||
anyrl-py | |||||
torch-rl | |||||
rlgraph | √ | √ |