Share your thoughts, 1 month free Claude Pro on usSee more

Long-context Variable Tracking on variable-tracking

79.5Accuracy

Qwen2.5-72B Baseline

Updated 3mo ago

Evaluation Results

Method	Links
Qwen2.5-72B Baseline 2026.04		79.5
Sub-token routing (Qwen2.5-72B) 2026.04		79.5
Expected Attention (Qwen2.5-72B) 2026.04		79.5
EA + Sub-token routing (Qwen2.5-72B) 2026.04		79.5
Qwen2.5-32B Baseline 2026.04		79
Sub-token routing (Qwen2.5-32B) 2026.04		79
Expected Attention (Qwen2.5-32B) 2026.04		79
EA + Sub-token routing (Qwen2.5-32B) 2026.04		79
Qwen2.5-14B Baseline 2026.04		77
Sub-token routing (Qwen2.5-14B) 2026.04		77
Expected Attention (Qwen2.5-14B) 2026.04		77
EA + Sub-token routing (Qwen2.5-14B) 2026.04		77
Qwen2.5-7B Baseline 2026.04		29.5
Sub-token routing (Qwen2.5-7B) 2026.04		29.5
Expected Attention (Qwen2.5-7B) 2026.04		29.5
EA + Sub-token routing (Qwen2.5-7B) 2026.04		29.5