Reinforcement Learning

From Humanoid Robots Wiki

Revision as of 06:21, 16 May 2024 by Vrtnis (talk | contribs) (→‎Training algorithms)

(diff) ← Older revision | Latest revision (diff) | Newer revision → (diff)

Jump to: navigation, search

Training algorithms

A2C (also see slides on Actor Critic methods at [1])
PPO
SAC

References

[1] Stanford CS224R

Resources

Mandy Zhao's Reinforcement Learning Notes

Retrieved from "http://54.204.126.50/index.php?title=Reinforcement_Learning&oldid=1042"

Software