LLM Judge

Benchmarks

Task Name	Dataset Name	SOTA Result	Trend
Controllability	LLM Judge	Controllability Score90.38		40
Image Generation	LLM-Judge Evaluation Set	Quality37.2		6

Showing 2 of 2 rows