Changes

Reinforcement Learning

92 bytes added, 01:52, 29 April 2024

no edit summary

== Training algorithms ==

* [https://en.wikipedia.org/wiki/Advantage_Actor_Critic A2C]

* [https://en.wikipedia.org/wiki/Proximal_policy_optimization PPO]

* [https://spinningup.openai.com/en/latest/algorithms/sac.html SAC]

== Resources ==

~~==Training algorithms==~~ ~~===~~* [https://enmandi-zhao.~~wikipedia~~gitbook.~~org~~io/~~wiki/Advantage_Actor_Critic A2C]===~~ ~~===[https://en.wikipedia.org/wiki/Proximal_policy_optimization PPO]===~~ ~~===[https://spinningup.openai.com/en/latest/algorithms/sac.html SAC~~deeprl-notes Mandy Zhao's Reinforcement Learning Notes]~~===~~

Anonymous user

194.195.93.80

Humanoid Robots Wiki β

Changes

Reinforcement Learning

Humanoid Robots Wiki ^β