LLM-simulated scientists

Benchmarks

Task Name	Dataset Name	SOTA Result	Trend
Automated Research	20 LLM-simulated scientists	Alignment Score8.963		7
Automated Research Efficiency Analysis	20 LLM-simulated scientists	Average API Calls15.8		5

Showing 2 of 2 rows