Share your thoughts, 1 month free Claude Pro on usSee more

Medical Reasoning on DDXPlus

90.2Performance Score

ACE

Updated 3mo ago

Evaluation Results

Method	Links
ACE 2025.10		90.2	-	-
Gemini-2.5-pro 2026.01		81.1	109.85	27.65
EvoRoute 2026.01		79.5	65.8	20.53
GEPA 2025.10		76.4	-	-
Base LLM 2025.10		75.2	-	-
MasRouter 2026.01		73.1	92.38	32.3
GraphRouter 2026.01		62.5	119.5	27.5
PromptLLM 2026.01		60.07	127.05	26.88
GPT-4o 2026.01		57.58	135.1	34.31
GPT-4.1 2026.01		55.3	89.82	21.95
Qwen3-14b 2026.01		41.26	14.16	31.67