Commonsense Reasoning Tasks

Benchmarks

Task Name	Dataset Name	SOTA Result	Trend
Commonsense Reasoning	Six commonsense reasoning tasks zero-shot	Average Accuracy (Zero-shot)77.51		99
Commonsense Reasoning	Commonsense Reasoning Tasks (ARC-e, OBQA, SIQA, ARC-c, WinoG, PIQA, BoolQ, HellaS) LLaMA3-8B	ARC-e Accuracy92.9		13

Showing 2 of 2 rows