Share your thoughts, 1 month free Claude Pro on usSee more

Multi-step Reasoning on SVAMP (Accuracy)

94Accuracy

eMoT

Updated 25d ago

Evaluation Results

Method	Links
eMoT 2026.06		94
BoT 2026.06		91.3
Qwen-32B (Direct) 2026.06		83
PaL 2026.06		79.4
ToT 2026.06		60
TILR 2026.06		33.9
Refinement 2026.06		31.5
Coconut 2026.06		30
CoT 2026.06		28.2
AdaAnchor 2026.06		18.4
No-CoT 2026.06		14.1