LLMs-Eval

Benchmarks

Task Name	Dataset Name	SOTA Result	Trend
Multi-modal reasoning	LLMs-Eval mini (test)	GeoQAtest Accuracy52.77		12

Showing 1 of 1 rows