Share your thoughts, 1 month free Claude Pro on usSee more

Language Modeling on C4 LLaMA-60M (val)

28.53Perplexity

FOAM-2

Updated 1mo ago

Evaluation Results

Method	Links
FOAM-2 2025.12		28.53	0.27
FOAM-3 2025.12		28.79	0.25
MUON 2025.12		28.93	0.3
Full-Adam 2025.12		29.57	0.34
Adam-Mini 2025.12		29.63	0.22
FOAM-Mini 2025.12		29.71	0.24
APOLLO-1/4 2025.12		31.18	0.28
APOLLO-1/8 2025.12		31.53	0.26
APOLLO-Mini 2025.12		31.58	0.24
GWT-Mini 2025.12		32.94	0.24
GaLore-1/4 2025.12		34.38	0.28
GaLore-1/8 2025.12		39.94	0.26