Summary

Benchmarks

Task Name	Dataset Name	SOTA Result
Preference Profile Estimation	Summary	Misprediction Rate0.002	24
Text Summarization	Summary	LLM-as-judge Score44.4	13
Summarization	Summary	Score46.4	13
Summarization	Summary (test)	Score41.31	5

Showing 4 of 4 rows