Share your thoughts, 1 month free Claude Pro on usSee more

Large Language Model Serving on vLLM benchmark (128 prompts, 32 pre-fill, 256 generation tokens)

76TTFT (ms)

DeInfer

Updated 3mo ago

Evaluation Results

Method	Links
DeInfer 2026.04		76	39
DeInfer 2026.04		77	68
DeInfer 2026.04		81	59
DeInfer 2026.04		82	76
DeInfer 2026.04		83	79
DeInfer 2026.04		83	74
Base 2026.04		6,999	311
Base 2026.04		19,341	764
Base 2026.04		21,740	812