Share your thoughts, 1 month free Claude Pro on usSee more

Home/Benchmarks

Regret minimization in Reinforcement Learning on Linear MDP

4Regret

DOERL

Updated 1mo ago

Evaluation Results

Method	Links
DOERL 2026.05		4	-	-

SOTA Paper

DOERL

Model-Based Reinforcement Learning with Double Oracle Efficiency in Policy Optimization and Offline Estimation

Dataset

Linear MDP

Follow for update

@wizwand_team Discord

Related Benchmarks

Regret Minimization in Reinforcement Learning on Tabular MDP Regret Minimization in Reinforcement Learning on General MDP

© 2026 wizwand

Blog Contact Changelog Swarm

Privacy Policy Terms of Service FAQs Swarm Docs