Chatbot Workload Efficiency on LLaMA 2 70B

315GPU Power (W)

GPU-Only

Updated 4mo ago

Evaluation Results

Method	Links
GPU-Only 2025.12		315	0	315	0.647
CXL-SpecKV 2025.12		342	184	526	0.34