Share your thoughts, 1 month free Claude Pro on usSee more

LLM Inference Scheduling on LMSYS-Chat-1M

0.1432Average Per-token Latency (s/token)

Oracle SJF

Updated 27d ago

Evaluation Results

Method	Links
Oracle SJF 2025.09		0.1432	-	-	-
Oracle SJF 2025.09		0.1532	-	-	-
PARS 2025.09		0.1864	-	-	-
Cross-Model PARS 2025.09		0.1879	-	-	-
PARS 2025.09		0.2069	-	-	-
Listwise SJF 2025.09		0.2146	-	-	-
Cross-Model PARS 2025.09		0.2559	-	-	-
Listwise SJF 2025.09		0.2749	-	-	-
Pointwise SJF 2025.09		0.3217	-	-	-
Pointwise SJF 2025.09		0.3427	-	-	-
FCFS 2025.09		0.521	-	-	-
FCFS 2025.09		1.2699	-	-	-
TIE 2026.04		2.41	4.05	204.03	475.1
LTR 2026.04		4.34	7.03	252.2	507.35
SSJF 2026.04		5.5	8.24	273.3	551.15
FCFS 2026.04		9.08	16.13	319.51	618.21
FCFS 2025.09		-	1.0911	-	-
Pointwise SJF 2025.09		-	0.6668	-	-
Listwise SJF 2025.09		-	0.5855	-	-
PARS 2025.09		-	0.4226	-	-
Cross-Model PARS 2025.09		-	0.5485	-	-
Oracle SJF 2025.09		-	0.259	-	-
FCFS 2025.09		-	2.3075	-	-
Pointwise SJF 2025.09		-	0.5535	-	-
Listwise SJF 2025.09		-	0.3061	-	-
PARS 2025.09		-	0.261	-	-
Cross-Model PARS 2025.09		-	0.2621	-	-
Oracle SJF 2025.09		-	0.2088	-	-