Two dim reward function

Benchmarks

Task Name	Dataset Name	SOTA Result	Trend
Regret Minimization	Two dim reward function synthetic (test)	Oracle Regret2,589.32		9
Regret Minimization	Two dim reward function weak adversaries Appendix A.7 (test)	Oracle Regret2,589.32		9

Showing 2 of 2 rows