Anthropic Harmless

Benchmarks

Task Name	Dataset Name	SOTA Result
Reward Modeling	Anthropic Harmless	Accuracy74.7	12
Reward Model Transfer	Anthropic Harmless (AHar)	AOG4.62	8
Open-ended Dialogue	Anthropic-Harmless ID	Win Rate68.1	4

Showing 3 of 3 rows