SOTA Large Language Model Evaluation on Knowledge Specialized Target (test) and PapersWithCode

56.5Weighted Average Score

CAMEL

Updated 2mo ago

Evaluation Results