Share your thoughts, 1 month free Claude Pro on usSee more

Multi-Objective Reinforcement Learning on Queue

1.6MER

HEURISTIC

Updated 4mo ago

Evaluation Results

Method	Links
HEURISTIC 2026.03		1.6	10.05
ENVELOPE 2026.03		3.54	25.1
DPI 2026.03		3.74	29.09
FIXED 2026.03		4.19	10.05
RS 2026.03		4.29	11.43
SR-PPO 2026.03		5.64	46.91
DPI 2026.03		10.34	39.95
DPI-PPO 2026.03		10.34	39.95
Dense Oracle 2026.03		14.41	49.27
MER-PPO 2026.03		15.01	0.98
RANDOM 2026.03		24.24	17.25