SOTA Large Language Model Evaluation on Math Specialized Target (test) and PapersWithCode

49.7Weighted Average Score

CAMEL

Updated 2mo ago

Evaluation Results