Share your thoughts, 1 month free Claude Pro on usSee more

Deep Reinforcement Learning on Gridworld (test)

74.2Usefulness

PPO DReST

Updated 3mo ago

Evaluation Results

Method	Links
PPO DReST 2026.04		74.2	74.7
A2C DReST 2026.04		74.2	76.9
PPO Default 2026.04		66.7	0
A2C Default 2026.04		63.5	0