Prominent Language Benchmarks

Benchmarks

Task Name	Dataset Name	SOTA Result	Trend
Zero-shot Language Modeling	Prominent Language Benchmarks (ARC, BoolQ, HellaSwag, OpenBookQA, PIQA, SciQ, TriviaQA, Winogrande)	ARC-Challenge Acc28.16		5

Showing 1 of 1 rows