Share your thoughts, 1 month free Claude Pro on usSee more

Long-context Language Modeling on RULER (4K Context)

95.3Accuracy

Full KV

Updated 1mo ago

Evaluation Results

Method	Links
Full KV 2025.10		95.3
H2O + OBCACHE-V&K 2025.10		82
H2O + OBCACHE-K 2025.10		81.3
TOVA + OBCACHE-V&K 2025.10		76.7
H2O + OBCACHE-V 2025.10		76
H2O + OBCACHE-V&K 2025.10		75.6
H2O + OBCACHE-K 2025.10		75.4
H2O 2025.10		75.3
TOVA 2025.10		74.5
H2O + OBCACHE-V 2025.10		68.6
H2O + OBCACHE-V&K 2025.10		67.8
H2O + OBCACHE-K 2025.10		67.6
H2O + OBCACHE-V&K 2025.10		67.5
H2O 2025.10		67.1
H2O + OBCACHE-K 2025.10		65.9
TOVA + OBCACHE-V&K 2025.10		65.5
TOVA 2025.10		61.8
H2O + OBCACHE-V 2025.10		59.9
H2O 2025.10		57.5
H2O + OBCACHE-V 2025.10		57.1
AdaKV + OBCACHE-V&K 2025.10		55.2
H2O 2025.10		54.2
H2O + OBCACHE-K 2025.10		47.7
H2O + OBCACHE-V&K 2025.10		46.3
H2O + OBCACHE-V 2025.10		37.7
H2O 2025.10		33.5
SnapKV + OBCACHE-K 2025.10		24.1
AdaKV 2025.10		21.5
SnapKV 2025.10		19.4