SOTA Large Language Model Evaluation on Code Specialized Target (test) and PapersWithCode

52.8Weighted Average Score

CAMEL

Updated 2mo ago

Evaluation Results