Share your thoughts, 1 month free Claude Pro on usSee more

Natural Language Inference on MultiMed-X SW

73.33Accuracy

MED-COREASONER

Updated 5mo ago

Evaluation Results

Method	Links
MED-COREASONER 2026.01		73.33
GPT-5.1 2026.01		72.67
GPT-5.2 2026.01		70
GPT-4o 2026.01		69.33
Claude-3.5-haiku 2026.01		56.67