CSR

Benchmarks

Task Name	Dataset Name	SOTA Result
Common-sense reasoning	CSR (ARC-Easy, ARC-Challenge, BoolQ, PIQA, SIQA, HellaSwag, OpenBookQA, WinoGrande) zero-shot lm-evaluation-harness v0.4.2	Accuracy68.95	32
Commonsense Reasoning	CSR (Commonsense Reasoning Suite)	CSR Accuracy67.3	14
Common Sense Reasoning	CSR zero-shot	CF Score5.2	2

Showing 3 of 3 rows