Core Capabilities

Benchmarks

Task Name	Dataset Name	SOTA Result	Trend
General Large Language Model Evaluation	Core Capabilities Aggregate	Average Score72.32		20

Showing 1 of 1 rows