Share your thoughts, 1 month free Claude Pro on usSee more

LLM-as-a-Judge Routing on 3 datasets Average (test)

90Accuracy

RACER

Updated 2mo ago

Evaluation Results

Method	Links
RACER 2026.05		90	3.9
M-IRT 2026.05		88.9	3.4
RouteLLM-MF 2026.05		88.2	4.1
RouterBench-KNN 2026.05		86.8	2.6
RACER 2026.05		85.8	3.4
RouteLLM-MF 2026.05		84.7	3.4
M-IRT 2026.05		84.3	2.7
RouterBench-KNN 2026.05		84.1	2.5
RACER 2026.05		72.2	3.6
M-IRT 2026.05		71.6	3.4
RouterBench-KNN 2026.05		71.3	2.6
RouteLLM-MF 2026.05		69.4	3.8