Share your thoughts, 1 month free Claude Pro on usSee more

Language Model Inference on Llama-2 7B-Chat

76Latency (ms/token)

ARC engine

Updated 4mo ago

Evaluation Results

Method	Links
ARC engine 2026.03		76
ARC engine 2026.03		139
Candle Q4 float 2026.03		175
Candle Q4 float 2026.03		1,250