Share your thoughts, 1 month free Claude Pro on usSee more

Medical Question Answering on LLMMed-Eval Medical

79.61Score

Gemini-2.5-pro

Updated 1mo ago

Evaluation Results

Method	Links
Gemini-2.5-pro 2026.05		79.61
External Evolving-RL 2026.05		73.76
EvoRubric 2026.05		73.46
GPT-4o 2026.05		72.71
Static Rubric-RL 2026.05		72.36
Base Model 2026.05		71.36
EvoRubric 2026.05		70.76
Static Rubric-RL 2026.05		69.26
Base Model 2026.05		68.06
External Evolving-RL 2026.05		67.31