LLM Evaluation Scenarios

Benchmarks

Task Name	Dataset Name	SOTA Result	Trend
Language Model Accuracy Evaluation	LLM Evaluation Scenarios	Accuracy85.44		9

Showing 1 of 1 rows