Share your thoughts, 1 month free Claude Pro on usSee more

Preference Classification on Anthropic HH Helpful (test)

57.6Accuracy

UMM-RM

Updated 5mo ago

Evaluation Results

Method	Links
UMM-RM 2025.11		57.6
UMM-RM 2025.11		55.2
Mean Optimization 2025.11		55
Worst-Case Optimization 2025.11		54.8
Uncertainty-Weighted Optimization 2025.11		54.6
UMM-RM 2025.11		54.2
Dense RM 2025.11		44.6