Share your thoughts, 1 month free Claude Pro on usSee more

Preference Classification on WebGPT comparisons (test)

60.8Accuracy

UMM-RM

Updated 5mo ago

Evaluation Results

Method	Links
UMM-RM 2025.11		60.8
Worst-Case Optimization 2025.11		60.6
Uncertainty-Weighted Optimization 2025.11		59.6
UMM-RM 2025.11		58.6
UMM-RM 2025.11		57.8
Dense RM 2025.11		52.2
Mean Optimization 2025.11		51.4