Deep Research Bench

Benchmarks

Task Name	Dataset Name	SOTA Result	Trend
Deep Research Evaluation	Deep Research Bench first training epoch (step 600)	Readability52.09		17
Deep Research Evaluation	Deep Research Bench (step 1100)	Readability53.81		16

Showing 2 of 2 rows