Share your thoughts, 1 month free Claude Pro on usSee more

General Reasoning on BIG-Bench Hard (val)

43.46Accuracy

TAIA

Updated 4mo ago

Evaluation Results

Method	Links
TAIA 2024.05		43.46
TAIA 2024.05		42.54
LoRA 2024.05		37.35
LoRA 2024.05		36.09
MOLORA 2024.05		35.85
MOLORA 2024.05		35.05
LoRA 2024.05		33.19
MOLORA 2024.05		32.64
TAIA 2024.05		32.54
TAIA 2024.05		31.47
TAIA 2024.05		31.3
TAIA 2024.05		30.96
TAIA 2024.05		30.93
Qwen1.5-7B 2024.05		30.76
TAIA 2024.05		30.2
TAIA 2024.05		30.03
LLaMA3-8B 2024.05		29.58
TAIA 2024.05		29.1
LoRA 2024.05		28.8
TAIA 2024.05		28.63
TAIA 2024.05		27.71
LLaMA2-7B 2024.05		26.36
TAIA 2024.05		26
LoRA 2024.05		24.07
MOLORA 2024.05		23.67
LoRA 2024.05		23.24
MOLORA 2024.05		22.5
TAIA 2024.05		22.49
MOLORA 2024.05		22.24
TAIA 2024.05		21.93
MOLORA 2024.05		20.21
LoRA 2024.05		19.09
TAIA 2024.05		18.86
Qwen1.5-1.8B 2024.05		16.8
LoRA 2024.05		13.9
MOLORA 2024.05		12.99