R-Bench-T

Benchmarks

Task Name	Dataset Name	SOTA Result	Trend
Code Reasoning	R-Bench-T Code	Accuracy49.91		24
Math Reasoning	R-Bench-T Math	Accuracy54.48		24

Showing 2 of 2 rows