Share your thoughts, 1 month free Claude Pro on usSee more

Reward Modeling on WebGPT

58.4Accuracy

UMM-RM

Updated 4mo ago

Evaluation Results

Method	Links
UMM-RM 2025.11		58.4
UMM-RM 2025.11		58.2
UMM-RM 2025.11		57.8
UMM-RM 2025.11		57.8
Dense RM 2025.11		57.2
UMM-RM 2025.11		54.2
UMM-RM 2025.11		54
Dense RM 2025.11		50.8