Share your thoughts, 1 month free Claude Pro on usSee more

Language Modeling on Language Modeling Dataset

8.31PPL

O-FANG

Updated 23d ago

Evaluation Results

Method	Links
O-FANG 2025.12		8.31	-
FP16 2026.07		8.74	-
TASA b4.0 2026.07		9.02	-
SpQR† 2026.07		9.06	-
GPTQ 2026.07		9.1	-
AWQ 2026.07		9.13	-
OBC 2025.12		9.17	-
HQQ 2026.07		9.23	-
RTN 2026.07		9.75	-
TASA b3.0 2026.07		9.96	-
OWQ 2026.07		10.16	-
GPTQ 2026.07		10.69	-
HQQ 2026.07		11.65	-
O-FANG 2025.12		11.72	-
Dense 2025.12		12.18	-
OBC 2025.12		14.04	-
PP 2025.12		15.31	-
FLAP 2025.12		16.32	-
SlimGPT w/o 2025.12		16.36	-
Token Filtering 2025.12		16.65	-
GPT-2 XL 2026.05		17.48	-
CCT-306M (RC2) 2026.05		21.27	-
GPT-2 Large 2026.05		22.05	-
Transformer-XL 2026.05		24	-
GPT-2 Medium 2026.05		26.37	-
GPT-2 Small 2026.05		37.5	-
PP 2025.12		39.4	-
SlimGPT w/o 2025.12		40.83	-
FLAP 2025.12		43.11	-
Token Filtering 2025.12		54.59	-
RTN 2026.07		106.75	-
Nesterov 2026.05		-	8.04
Nesterov 2026.05		-	170.9
Nesterov 2026.05		-	487.6
CGAD 2026.05		-	6.79
CGAD 2026.05		-	8.46
CGAD 2026.05		-	8.96
Nesterov 2026.05		-	9.7
Nesterov 2026.05		-	241.2
Nesterov 2026.05		-	319
CGAD 2026.05		-	7.48
CGAD 2026.05		-	9.94
CGAD 2026.05		-	7.44
Nesterov 2026.05		-	46.69
Nesterov 2026.05		-	65.31
CGAD 2026.05		-	10.48
CGAD 2026.05		-	10.9
CGAD 2026.05		-	11.7
Adam-Decay 2026.05		-	11.28
Adam-Decay 2026.05		-	11.3
Adam-Decay 2026.05		-	11.69
SDM 2026.05		-	11.3
SDM 2026.05		-	11.44
SDM 2026.05		-	11.69
DelayedNesterov 2026.05		-	11.1
DelayedNesterov 2026.05		-	10.39
DelayedNesterov 2026.05		-	11.69