ODA

Benchmarks

Task Name	Dataset Name	SOTA Result	Trend
Multi-domain language model evaluation	ODA benchmark suite (test)	General Accuracy71.2		21
Multi-domain language model evaluation	ODA benchmark suite 1.0 (full)	General Score-		0

Showing 2 of 2 rows