Downstream

Benchmarks

Task Name	Dataset Name	SOTA Result	Trend
Multimodal Reasoning	Downstream Overall	BoN@8 Accuracy55.22		12
Downstream Task Evaluation	Downstream	Throughput (tokens/s)32.43		4

Showing 2 of 2 rows