Share your thoughts, 1 month free Claude Pro on usSee more

Personalized Reward Modeling on Reddit TLDR 150 examples Unseen

69.8User-level Accuracy

MRM

Updated 5mo ago

Evaluation Results

Method	Links
MRM 2026.01		69.8
MRM 2026.01		69.5
LoRe 2026.01		68.8
GPO 2026.01		68.6
BT 2026.01		68.2
SynthesizeMe 2026.01		68
VPL 2026.01		67.9
PAL 2026.01		66.7
SynthesizeMe 2026.01		66.3
Skywork-Reward V2 2026.01		64.5
Skywork-Reward V1 2026.01		62.6