Average across all datasets

Benchmarks

Task Name	Dataset Name	SOTA Result	Trend
Rejection Accuracy Evaluation	Average across all datasets (test)	G-NLL0.612		31

Showing 1 of 1 rows