Share your thoughts, 1 month free Claude Pro on usSee more

Common Sense Reasoning on PIQA (dev)

83.2Accuracy

Megatron-NLG

Updated 3mo ago

Evaluation Results

Method	Links
Megatron-NLG 2021.12		83.2
GPT-3 2021.12		82.3
Gopher 2021.12		81.8
GLaM 2021.12		81.8
GLaM 2021.12		81.4
GPT-3 2021.12		81
GPT-3 2021.12		80.5
GLaM 2021.12		80.4
CKT 2023.06		76.07
CALM 2023.06		75.11
Content-SharpRouter 2026.03		74.37
Hier-GateNet 2026.03		74.37
Gated DeltaNet 2026.03		74.1
AdaMulti-PathGateNet 2026.03		74.1
Mamba2 2026.03		73.78
DeltaNet 2026.03		73.12
PathGate-FusionNet 2026.03		72.91
FusionGated-FIRNet 2026.03		72.91
T5 2023.06		72.19