Helpful Assistant

Benchmarks

Task Name	Dataset Name	SOTA Result
Helpful Assistant Alignment	Helpful Assistant normalized rewards (test)	Helpfulness Reward (r1)53	60
Three-objective alignment	Helpful Assistant (test)	Helpfulness Score0.74	36
Preference Optimization	Helpful Assistant	Helpfulness Score53	30
Multi-objective alignment	Helpful Assistant (test)	Helpfulness Score0.76	9
Multi-Objective Optimization	Helpful Assistant Harmless-helpful	MPD1.015	4
Multi-Objective Optimization	Helpful Assistant Humor-helpful	MPD1.439	4

Showing 6 of 6 rows