Share your thoughts, 1 month free Claude Pro on usSee more

General Knowledge Evaluation on MMLU Perturbed

53.5Accuracy

NPO+KL w/ RNA

Updated 3mo ago

Evaluation Results

Method	Links
NPO+KL w/ RNA 2025.01		53.5
RMU w/ RNA 2025.01		47.3
NPO+KL w/ RNA 2025.01		47.3
RMU w/ RNA 2025.01		42.2
RMU 2025.01		34.4
NPO+KL 2025.01		31.4
RMU 2025.01		27.2
NPO+KL 2025.01		26.2