Share your thoughts, 1 month free Claude Pro on usSee more

Medical Question Answering on PubMedQA Reasoning Required

82Accuracy

GPT-4 (Medprompt)

Updated 2mo ago

Evaluation Results

Method	Links
GPT-4 (Medprompt) 2023.11		82
Med-PaLM 2 2023.11		81.8
Flan-PaLM 540B 2023.11		79
GPT-4 2023.11		75.2
TEXTRESNET 2026.02		60.31
DSPy 2026.02		60.26
HBC 2026.02		58.8
CoT 2026.02		57.34
TextGrad 2026.02		56.96
TextGrad 2026.02		56.12