Share your thoughts, 1 month free Claude Pro on usSee more

RO reformulation on Random In-Distribution

97.4Accuracy

AutoREM

Updated 2mo ago

Evaluation Results

Method	Links
AutoREM 2026.05		97.4	6,386
Expert Prompt 2026.05		92.7	8,750
Max Thinking 2026.05		90.6	13,857
Base LLM 2026.05		87.5	7,777
ACE 2026.05		87	4,419
ReasoningBank 2026.05		85.4	6,575