using deterministic policy in enviroment like lunarlander? #193

MohammadAsadolahi · 2022-06-07T10:39:46Z

Hi and thank you for such a genius algorithm.
I wonder how by using mu of gaussian policy in sac in enviroments like lunar lander is it guranteed to converge cuz i see some trials fails to converges. specialy on lunar lander and humnoid v3

MohammadAsadolahi changed the title ~~Why SAC is considered as an off policy algorithm?~~ using deterministic policy in enviroment like lunarlander? Jun 16, 2022

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

using deterministic policy in enviroment like lunarlander? #193

using deterministic policy in enviroment like lunarlander? #193

MohammadAsadolahi commented Jun 7, 2022 •

edited

Loading

using deterministic policy in enviroment like lunarlander? #193

using deterministic policy in enviroment like lunarlander? #193

Comments

MohammadAsadolahi commented Jun 7, 2022 • edited Loading

MohammadAsadolahi commented Jun 7, 2022 •

edited

Loading