Share your thoughts, 1 month free Claude Pro on usSee more

Single-Hop QA on NQ

48.5Accuracy

SLEA-RL

Updated 4mo ago

Evaluation Results

Method	Links
SLEA-RL 2026.03		48.5
IGPO 2026.03		46.7
GiGPO 2026.03		46.4
SkillRL 2026.03		45.9
ZeroSearch 2026.03		43.6
EvolveR 2026.03		43.5
GSPO 2026.03		41.5
RLOO 2026.03		40.7
GRPO 2026.03		40.3
Search-R1 2026.03		39.3
PPO 2026.03		38.7
Reinforce++ 2026.03		34.3
RAG 2026.03		27.4
R1-Instruct 2026.03		21
Search-o1 2026.03		19.4
CoT 2026.03		12.8
Qwen2.5 2026.03		11.6