Share your thoughts, 1 month free Claude Pro on usSee more

Language Model Inference on stories100m 110M parameters

298.7Tokens/s

PyTorch (Accelerate)

Updated 5mo ago

Evaluation Results

Method	Links
PyTorch (Accelerate) 2026.01		298.7	3.3
bare_metal::Transformer 2026.01		61.3	16.3
Scalar C++ 2026.01		24	41.6