Share your thoughts, 1 month free Claude Pro on usSee more

General Language Modeling Evaluation on Aggregate Wino Hella ARC-E ARC-C MMLU

56.67Average Accuracy

Teacher (GPT-OSS-20B)

Updated 6d ago

Evaluation Results

Method	Links
Teacher (GPT-OSS-20B) 2026.05		56.67
DO-ACP 2026.05		33.71
ACP 2026.05		33.36
CP 2026.05		32.86
ACP 2026.05		32.82
SF 2026.05		32.15
DO-ACP 2026.05		32.11
SF 2026.05		31.72
CP 2026.05		31.49
Random FFN + teacher attn 2026.05		30.46
Random initialization 2026.05		30.02