Share your thoughts, 1 month free Claude Pro on usSee more

Inference Throughput on Llama-8B

115.2Throughput (Tokens/s)

GPTQ

Updated 5mo ago

Evaluation Results

Method	Links
GPTQ 2026.01		115.2
HeRo-Q 2026.01		113.1
SpinQuant 2026.01		112.8
FP16 2026.01		48.5