Skip to content

Latest commit

 

History

History
53 lines (46 loc) · 2.14 KB

README.md

File metadata and controls

53 lines (46 loc) · 2.14 KB

RL practice

Collection of everything that i learn about Reinforcement Learning

Basic Implementation

  • Value iteration
  • Policy iteration
  • Monte-Carlo Method
  • SARSA
  • Q-learning
  • Actor-Critic Method
  • REINFORCE

Basic theory

  • 팡요랩의 강화학습의 기초이론 1강
  • 팡요랩의 강화학습의 기초이론 2강
  • 팡요랩의 강화학습의 기초이론 3강
  • 팡요랩의 강화학습의 기초이론 4강
  • 팡요랩의 강화학습의 기초이론 5강
  • 팡요랩의 강화학습의 기초이론 6강
  • 팡요랩의 강화학습의 기초이론 7강
  • 팡요랩의 강화학습의 기초이론 8강
  • 팡요랩의 강화학습의 기초이론 9강
  • 팡요랩의 강화학습의 기초이론 10강
  • 모두를 위한 RL강좌 :: Lecture1&2 Playing OpenAI GYM Games
  • 모두를 위한 RL강좌 :: Lab2 Playing OpenAI GYM Games
  • 모두를 위한 RL강좌 :: Lecture3 Dummy Q-learning(table)
  • 모두를 위한 RL강좌 :: Lab3 Dummy Q-learning(table)
  • 모두를 위한 RL강좌 :: Lecture4 Q-learning , exploit&exploration and discounted reward
  • 모두를 위한 RL강좌 :: Lab4 Q-learning , exploit&exploration and discounted reward
  • 모두를 위한 RL강좌 :: Lecture5 Q-learning on Nondeterministic worlds!
  • 모드를 위한 RL강좌 :: Lab5 Q-learning on Nondeterministic worlds!
  • 모드를 위한 RL강좌 :: Lecture6 Q-Network
  • 모드를 위한 RL강좌 :: Lab6-1 Q-Network for Frozen Lake
  • 모드를 위한 RL강좌 :: Lab6-2 Q-Network for Cart Pole
  • 모드를 위한 RL강좌 :: Lecture7 DQN
  • Pytorch KR :: Basic
  • VanilaPG Review / Implementation
  • NPG Review / Implementation
  • DQN Review / Implementation
  • PPO Review / Implementation
  • DDPG Review / Implementation
  • HER Review / Implementation
  • HAC Review / Implmentation
  • A3C Review / Implementation
  • ACER Review / Implementation
  • A2C Review / Implementation
  • SAC Review / Implementation
  • PPO-C Review / Implementation