Share your thoughts, 1 month free Claude Pro on usSee more

General Language Understanding on MMLU (Accuracy, IR)

71.6Accuracy

Qwen2.5-14B

Updated 3mo ago

Evaluation Results

Method	Links
Qwen2.5-14B 2026.04		71.6	4.7
HyTuning 2026.04		71.5	3.7
HyTuning 2026.04		61.4	8.1
Qwen2.5-7B 2026.04		61.3	12.6
HyTuning 2026.04		55.2	9.9
INTUITOR 2026.04		47.6	21.1
RLPR 2026.04		45.1	23.9
RLVR 2026.04		45	24
HPT 2026.04		45	24
Qwen2.5-3B 2026.04		44.9	24.1
RD 2026.04		44.9	24.5
SFT 2026.04		44.3	25.1