Multiple-choice QA Benchmarks

Benchmarks

Task Name	Dataset Name	SOTA Result	Trend
Multiple-choice QA	Multiple-choice QA Benchmarks (PIQA, OpenBookQA, HellaSwag, ARC)	PIQA Accuracy68.39		16

Showing 1 of 1 rows