Share your thoughts, 1 month free Claude Pro on usSee more

Long-context reasoning on BABILong

14.1Err (2k Context)

RoPE++EH

Updated 1mo ago

Evaluation Results

Method	Links
RoPE++EH 2025.12		14.1	15.6	12.2	9.9	8.3	9.7	11.6	-	-	-
RoPE 2025.12		17.7	16.1	9.1	9.4	5.9	7.8	11	-	-	-
RoPE++EC 2025.12		19.8	19.8	16.1	15.8	12.3	12.8	16.1	-	-	-
0-shot 2026.06		22.4	23.9	21	-	-	-	23.3	-	20.3	28.8
0-shot + YaRN 2026.06		23.4	26.2	21.6	-	-	-	25.8	-	31.2	26.5
0-shot 2026.06		23.7	25.6	21.6	-	-	-	25.6	-	31.2	26.1
0-shot + YaRN 2026.06		25	26.6	22	-	-	-	23.9	-	19.7	26.1
RoPE++EH 2025.12		31.9	26.5	18.6	16.2	11	12.2	19.4	-	-	-
RoPE++EC 2025.12		32.4	29.9	24.4	24.5	18.6	14.8	24.1	-	-	-
RoPE 2025.12		33.5	30.7	23.6	22	15.1	12.1	22.8	-	-	-
RPE 2026.06		82.9	85.6	83.6	-	-	-	82.9	-	79.3	83.3
Randomized YaRN 2026.06		90.8	92.5	93.8	-	-	-	91.4	-	89.5	90.2
Trained YaRN 2026.06		92.4	91.5	89.5	-	-	-	90.5	-	87.2	91.7
LoRA 2026.06		95.1	95.7	93.1	-	-	-	95.1	-	95.4	96.2
Randomized YaRN 2026.06		95.1	98	98.7	-	-	-	97.4	-	96.4	98.9
Trained YaRN 2026.06		98	96.7	95.7	-	-	-	97.5	-	97.4	99.6
Qwen3-1.7B 2026.05		-	-	-	-	-	-	-	64.54	-	-
LoRA 2026.05		-	-	-	-	-	-	-	65.74	-	-
MiLoRA 2026.05		-	-	-	-	-	-	-	65.98	-	-
OPLoRA 2026.05		-	-	-	-	-	-	-	65.23	-	-
CorDA 2026.05		-	-	-	-	-	-	-	65.57	-	-
LoRA-Null 2026.05		-	-	-	-	-	-	-	66.07	-	-
CorDA 2026.05		-	-	-	-	-	-	-	66.06	-	-
LoRA-Null 2026.05		-	-	-	-	-	-	-	65.52	-	-
FoLoRA 2026.05		-	-	-	-	-	-	-	66.34	-	-
FoLoRA 2026.05		-	-	-	-	-	-	-	66.09	-	-
FoLoRA 2026.05		-	-	-	-	-	-	-	66.5	-	-
FoLoRA 2026.05		-	-	-	-	-	-	-	66.17	-	-