Share your thoughts, 1 month free Claude Pro on usSee more

General Language Proficiency on Aggregated (GSM8K, TruthfulQA, TriviaQA, CNN/DM, MMLU)

48.6Average Score

LoRA Tuning

Updated 5mo ago

Evaluation Results

Method	Links
LoRA Tuning 2024.06		48.6
Full Fine-tuning 2024.06		47.79
Ours 2024.06		46.09
Proxy Tuning 2024.06		44.43
Full Fine-tuning 2024.06		44.13
Ours 2024.06		34.86
Proxy Tuning 2024.06		31.74
Base Model 2024.06		29.93
Full Fine-tuning 2024.06		25.33