Share your thoughts, 1 month free Claude Pro on usSee more

Scientific Question Answering on SuperGPQA*

62.4Accuracy

GPT-5

Updated 1mo ago

Evaluation Results

Method	Links
GPT-5 2025.08		62.4	3.8
Gemini-2.5-Pro 2025.08		60.4	0.3
Gemini-2.5-Pro 2025.08		60.1	-
o3 2025.08		59.5	4.6
GPT-5 2025.08		58.6	-
o4-mini 2025.08		57.1	8.5
o3 2025.08		54.9	-
o3-mini 2025.08		54	13.5
Claude-Sonnet-4 2025.08		49.8	4.6
o4-mini 2025.08		48.6	-
Claude-Sonnet-4 2025.08		45.2	-
o3-mini 2025.08		40.5	-