Share your thoughts, 1 month free Claude Pro on usSee more

Multitask Language Understanding on MMMLU Korean 1.0 (test)

41.94Accuracy

CLO

Updated 3mo ago

Evaluation Results

Method	Links
CLO 2025.05		41.94
CLO 2025.05		39.7
SFT-tgt 2025.05		36.8
SFT 2025.05		35.9
SFT 2025.05		34.39
CLO 2025.05		32.73
SFT-tgt 2025.05		29.61
CLO 2025.05		29.09
CLO 2025.05		28.31
SFT+DPO 2025.05		28
SFT-tgt 2025.05		27.65
SFT+DPO 2025.05		27.48
SFT+DPO 2025.05		26.79
SFT+DPO 2025.05		26.77
SFT 2025.05		25.94
SFT-tgt 2025.05		25.31
SFT 2025.05		25.31
SFT 2025.05		23.47