Difference between revisions of "Reinforcement Learning"

Revision as of 06:42, 24 April 2024 (edit) 69.181.66.238 (talk) (Created page with " ==Training algorithms== ===A2C=== ===PPO===")		Revision as of 22:36, 24 April 2024 (edit) (undo) 104.7.66.79 (talk) (→‎PPO) Newer edit →
Line 6:		Line 6:
	===A2C===		===A2C===

−	===PPO===	+	===[https://en.wikipedia.org/wiki/Proximal_policy_optimization PPO]===

Revision as of 22:36, 24 April 2024