Share your thoughts, 1 month free Claude Pro on usSee more

Medical Knowledge on HealthBench (Pass@1)

92.82Pass@1

GPT-5.2-chat (teacher)

Updated 2mo ago

Evaluation Results

Method	Links
GPT-5.2-chat (teacher) 2026.05		92.82
ROPD 2026.05		86.87
OVD 2026.05		85.98
GAD 2026.05		85.7
T-Judge 2026.05		85.58
Qwen3-4B (student) 2026.05		85.3
ROPD 2026.05		84.92
T-Judge 2026.05		84.52
OVD 2026.05		83.68
GAD 2026.05		83.57
Qwen3-4B (student) 2026.05		83.32