Share your thoughts, 1 month free Claude Pro on usSee more

Diagnostic Reasoning Generalization on CheXbench (test)

68.7Visual QA: Rad-Restruct (Top-1 Acc)

MedRAX

Updated 3mo ago

Evaluation Results

Method	Links
MedRAX 2026.04		68.7	82.9	52.6	68.1
XrayClaw 2026.04		66.3	85.6	62.1	70.7
CheXagent 2026.04		57.1	78.1	59	64.7
GPT-4o 2026.04		53.9	85.4	51.1	63.5
LLaVA-Med 2026.04		34.9	55.5	45.8	45.4