Share your thoughts, 1 month free Claude Pro on usSee more

Medical Visual Question Answering on MedXpertQA

56Accuracy

GEMINI-3-FLASH

Updated 1mo ago

Evaluation Results

Method	Links
GEMINI-3-FLASH 2026.01		56
GPT-5 2026.01		54.8
Gemini 2.5 Pro 2026.04		46.6
OpenAI-o3 2026.04		44.1
GPT-4.1 2026.04		40.8
GPT-5 2026.04		40.4
MedGemma 27B 2026.06		33.7
OctoMed 7B 2026.06		33.32
QWEN3-VL-8B-INSTRUCT + MED-SCOUT 2026.01		30.8
QWEN3-VL-8B-INSTRUCT 2026.01		30.4
LINGSHU-7B + MED-SCOUT 2026.01		28
MedAgent-Pro 2026.04		27.8
MedGemma 1.5 4B 2026.06		27.79
QWEN3-VL-4B-INSTRUCT + MED-SCOUT 2026.01		27.7
LINGSHU-7B 2026.01		27.4
QWEN3-VL-4B-INSTRUCT 2026.01		27
Qwen2.5-VL-32B 2026.04		26.8
MedTutor-R1 2025.12		25.1
Qwen2.5-VL-7B + OPENMEDREASON 2026.06		24.95
QWEN2.5-VL-3B-INSTRUCT 2026.01		24.3
Mini-o3-7B-v1 2026.04		24.3
MedLVR 2026.04		24.3
InternVL3-8B 2026.04		23.8
MedVL-Thinker 7B 2026.06		23.8
HuatuoGPT-Vision-34B 2026.04		23.6
DeepEyes-7B 2026.04		23.6
Lingshu 7B 2026.06		23.51
AURA 2026.04		23.5
PixelReasoner-RL-v1-7B 2026.04		23.5
VILA-M3-40B 2026.04		23
Med-R1 2026.04		22.9
HUATUOGPT-VISION-7B + MED-SCOUT 2026.01		22.7
MedTutor-R1 w/ LLaVA-based 2025.12		22.67
Qwen2.5-VL-7B 2026.06		22.62
MMedAgent-RL-7B 2026.04		22.6
Qwen2.5-VL-7B 2026.04		22.5
INTERNVL3-8B 2026.01		22.4
HUATUOGPT-VISION-7B 2026.01		22.4
MMedAgent-7B 2026.04		22.3
MEDGEMMA-4B-IT 2026.01		22
QWEN2.5-VL-7B-INSTRUCT 2026.01		21.9
MedVLM-R1 2026.04		21.7
QoQ-Med-VL 7B 2026.06		21.4
MedTutor-R1 w/o RL 2025.12		20.8
LLaVA-Next-7B 2026.04		20.7
LLAVA-MED-7B 2026.01		19.9
LLaVA-Med-7B 2026.04		19.9
RadFM 2026.04		19.8
LLaVA-Next-13B 2026.04		19.6
SMR-Agents 2026.04		19.6
Med-Flamingo 2026.04		19.3
Qwen2.5VL 2025.12		18.39