WebText

Benchmarks

Task Name	Dataset Name	SOTA Result
Language Modeling	WebText	Mauve58	33
Text Generation	WebText	ROUGE-137.5	15
Language Modeling	WebText (test)	Diversity (Div)0.87	14
Language Generation	WebText (completions)	Perplexity (PPL)10.16	7
Text Generation Evaluation Correlation	WebText (test)	Perplexity (PPL)0.643	3
Open-ended Text Generation	WebText (test)	Same Preference Count97	2

Showing 6 of 6 rows