Share your thoughts, 1 month free Claude Pro on usSee more

Multitask Language Understanding on MMLU (Accuracy and AVERAGE MEAN)

50.12Accuracy

Full-data Fine-tuning

Updated 2mo ago

Evaluation Results

Method	Links
Full-data Fine-tuning 2025.10		50.12	48.99
TRIM 2025.10		49.33	48.56
LESS 2025.10		49.23	48.27
TAGCOS 2025.10		48.12	46.6
S2L 2025.10		46.7	45.56
CLD 2025.10		46.13	42.61
BM25 2025.10		46.12	45.41
Random 2025.10		45.84	45.14
DSIR 2025.10		45.73	42.02
Pretrained (no Fine-tuning) 2025.10		45.6	43.43
RDS 2025.10		45.27	42.17