Share your thoughts, 1 month free Claude Pro on usSee more

Inference Throughput on Llama-1B

310.5Throughput (Tokens/sec)

GPTQ

Updated 5mo ago

Evaluation Results

Method	Links
GPTQ 2026.01		310.5
HeRo-Q 2026.01		303.1
SpinQuant 2026.01		302.8
FP16 2026.01		205.2