Zero-shot Language Modeling

Benchmarks

Dataset Name	SOTA Method	Metric
LM Evaluation Harness 0-shot	LO-BCQ	WG80.66	30	4mo ago
Standard Language Modeling Suite WikiText-103, LAMBADA	Q-Delta	WikiText-103 Perplexity19.21	19	1mo ago
BLiMP (test)	SwitchHead	Accuracy79.6	8	4mo ago
LLaMA-3-1B Zero-shot		Perplexity (PPL)9.6	5	2mo ago
Prominent Language Benchmarks (ARC, BoolQ, HellaSwag, OpenBookQA, PIQA, SciQ, TriviaQA, Winogrande)	Xmodel-LM 1.1B	ARC-Challenge Acc28.16	5	4mo ago
CBT (test)	SwitchHead MAC-matched	Accuracy84.2	4	4mo ago
Perplexity-based tasks (Wikitext, LAMBADA) zero-shot		Wikitext Perplexity25.46	2	4mo ago

Showing 7 of 7 rows