Story Premise Human Evaluation Set

Benchmarks

Task Name	Dataset Name	SOTA Result	Trend
Story Premise Diversity Evaluation	Story Premise Human Evaluation Set 600 premises 1.0 (test)	Average Score3.875		6

Showing 1 of 1 rows