Share your thoughts, 1 month free Claude Pro on usSee more

In-context retrieval on DROP

88.6Accuracy

BERT-Judge

Updated 3mo ago

Evaluation Results

Method	Links
BERT-Judge 2026.04		88.6
Regex 2026.04		77
LLM-Judge 2026.04		69.3
Transformer++ 2026.03		28.2
Hybrid Gated DeltaNet + M2RNN-3 2026.03		27.2
Hybrid M2RNN 2026.03		26.8
Hybrid Mamba-2 2026.03		26.4
Hybrid Mamba-2 + M2RNN-3 2026.03		26.4
Hybrid Mamba-2 + M2RNN-1 2026.03		26.3
Hybrid Gated DeltaNet 2026.03		26
Hybrid Gated DeltaNet + M2RNN-1 2026.03		25.6
Gated DeltaNet 2026.03		24.9
M2RNN 2026.03		22.9
Mamba-2 2026.03		19.5
GRU 2026.03		17.2
RNN 2026.03		14.6