Share your thoughts, 1 month free Claude Pro on usSee more

General Language Modeling on BIG-Bench

85.6Accuracy

TALE

Updated 2mo ago

Evaluation Results

Method	Links
TALE 2025.10		85.6	0.25	-14.4
TALE 2025.10		81.6	0.14	-19.9
BSBA 2025.10		81.6	-	-19.9
Baseline 2025.10		79.2	-	-
Baseline 2025.10		77.2	-	-
BSBA 2025.10		76.4	-	-32.2
TALE 2025.10		75.4	0.22	-28
TALE 2025.10		75	0.25	-27.1
BSBA 2025.10		72.6	-	-33.8
BSBA 2025.10		71	-	-45.1
Baseline 2025.10		70.4	-	-
Baseline 2025.10		67.4	-	-