Share your thoughts, 1 month free Claude Pro on usSee more

Multi-discipline Understanding on MMLU

75.05Accuracy

POP

Updated 3mo ago

Evaluation Results

Method	Links
POP 2026.02		75.05	-
Full Model 2026.02		74.95	-
Wanda 2026.02		73.78	-
Full Model 2026.02		71.46	-
POP 2026.02		71.37	-
Wanda 2026.02		69.7	-
Full Model 2026.02		68.33	-
POP 2026.02		67.43	-
Wanda 2026.02		65.87	-
ShortGPT 2026.02		65.8	-
JET 2025.09		63.9	860
Laser-DE 2025.09		63.4	1,027
Laser-D 2025.09		62.3	1,059
SFT 2025.09		60.2	1,044
Base 2025.09		60.1	1,022
DPO 2025.09		60.1	947
DAPO 2025.09		58.9	907
AdaptThink 2025.09		57.3	840
LCR1 2025.09		56.5	611
Laser-D 2025.09		47.2	1,143
DAPO 2025.09		46.5	856
Laser-DE 2025.09		46.2	1,217
SFT 2025.09		44.7	1,122
JET 2025.09		44.6	715
DPO 2025.09		44.5	1,143
AdaptThink 2025.09		44.5	1,224
Base 2025.09		43.8	1,306
LCR1 2025.09		42.7	744
SliceGPT 2026.02		39.16	-
SliceGPT 2026.02		34.97	-
ShortGPT 2026.02		33.85	-
ShortGPT 2026.02		23.81	-
SliceGPT 2026.02		22.95	-