Share your thoughts, 1 month free Claude Pro on usSee more

Science on MMLU-Pro (test)

41.9Accuracy

Base

Updated 2mo ago

Evaluation Results

Method	Links
Base 2026.05		41.9
Base 2026.05		41.9
Low-SFT 2026.05		41.7
DFT 2026.05		41.3
Self-SFT 2026.05		41.1
Anchored Learning 2026.05		40.9
Self-sft 2026.05		39.4
KL-SFT 2026.05		38.3
SFT 2026.05		37.5
STM 2026.05		36.1
Iter-SFT 2026.05		35.8
Anchored Learning 2026.05		35.6
Iter-SFT 2026.05		33.8
Low-SFT 2026.05		31.7
DFT 2026.05		29.7
STM 2026.05		27.7
SFT 2026.05		10.9
KL-SFT 2026.05		9.6