General LLM Benchmarks

Benchmarks

Task Name	Dataset Name	SOTA Result	Trend
General Language Understanding	General LLM Benchmarks (ARC-C, CSQA, HellaSwag, LAMBADA, MMLU, OpenBookQA, PIQA, Winogrande) (test)	ARC-C Accuracy59.5		22

Showing 1 of 1 rows