Share your thoughts, 1 month free Claude Pro on usSee more

Question Answering on SuperGPQA Law

43.8Accuracy

Llama3.1-70B

Updated 4mo ago

Evaluation Results

Method	Links
Llama3.1-70B 2026.01		43.8
Qwen3-30B 2026.01		42.5
Qwen3-30B 2026.01		42.4
Qwen3-30B 2026.01		42.1
Llama3.1-70B 2026.01		41.7
Llama3.1-70B 2026.01		40.3
Nemotron1.5-49B 2026.01		38
Nemotron1.5-49B 2026.01		37.7
Nemotron1.5-49B 2026.01		37.6
SaulLM 2026.01		28.4