Open-ended Reasoning on GSM8K Multi

64.3Accuracy

Self-Agreement

Updated 5mo ago

Evaluation Results

Method	Links
Self-Agreement 2023.11		64.3
Zero-Shot CoT 2023.11		59.7