LAM Evaluation Benchmark

Benchmarks

Task Name	Dataset Name	SOTA Result	Trend
Benchmark Subset Selection	LAM Evaluation Benchmark 40 tasks	Pearson Correlation0.977		60

Showing 1 of 1 rows