LLM Evaluation Benchmarks

Benchmarks

Task Name	Dataset Name	SOTA Result	Trend
Language Modeling Accuracy	LLM Evaluation Benchmarks Zero-shot	Llama-2 7B Accuracy68.8		9

Showing 1 of 1 rows