Share your thoughts, 1 month free Claude Pro on usSee more

RO reformulation on Random

96.9Accuracy

AutoREM

Updated 2mo ago

Evaluation Results

Method	Links
AutoREM 2026.05		96.9	2,006
ACE 2026.05		71.9	3,184
Expert Prompt 2026.05		68.8	3,734
Max Thinking 2026.05		59.4	13,971
ReasoningBank 2026.05		53.1	2,510
Base LLM 2026.05		46.9	4,748