SOTA Commonsense Reasoning on HellaSwag (first 1000 examples) and PapersWithCode

38Accuracy (HellaSwag 1k)

k=64 (DR only)

Updated 3mo ago

Evaluation Results