PG19

Benchmarks

Task Name	Dataset Name	SOTA Result
Long-context Input (Summarization)	PG19	Speedup1.26	26
Language Modeling	PG19 tokens (test)	Bits per Token3.49	14
Language Modeling	PG19 bytes (test)	Bits Per Token0.935	14
Language Modeling	PG19 T5 (val)	PPLX15.31	10
Language Modeling	PG19 32K	Perplexity7.96	8
Language Modeling	PG19 16K	Perplexity8.01	8
Language Modeling	PG19 4K	Perplexity8.68	8
Language Modeling	PG19 100K	Perplexity8.24	6
Lossless text compression	PG19	Compression Ratio (bits)6.77	5
Long-sequence generation	PG19 synthetic prompts	Max Batch Size80	4

Showing 10 of 10 rows