Helpfulness

Benchmarks

Task Name	Dataset Name	SOTA Result
Helpfulness	Helpfulness	Average Win Rate97	21
Value Alignment	Helpfulness 4	Conformity Score4.364	16
Text Classification	Helpfulness	F1 Score72.27	13
Simulation Accuracy	Helpfulness (val)	Accuracy56.8	8
LLM Alignment	Helpfulness	Truthfulness Index0.891	7
Helpfulness Evaluation	Helpfulness (evaluation set)	Win Rate84.05	5

Showing 6 of 6 rows