CrossAlpaca-Eval

Benchmarks

Task Name	Dataset Name	SOTA Result	Trend
Open-ended Question Answering	CrossAlpaca-Eval en 2.0	GPT-4o Score8.58		8
Open-ended Question Answering	CrossAlpaca-Eval zh 2.0	GPT-4o Score8.53		4

Showing 2 of 2 rows