SOTA Preference Prediction on RM-Bench and PapersWithCode

87.8Accuracy

Updated 3mo ago

Evaluation Results

Method	Links
C2 2026.04		87.8
Reasoning RM + External-Rubric (32B) 2026.04		84.6
Reasoning RM 2026.04		81.3
Reasoning RM + Self-Rubric 2026.04		81.3
Base Model 2026.04		80.1
Reasoning RM + External-Rubric (32B) 2026.04		77.7
C2 2026.04		65.6
Reasoning RM 2026.04		64.9
Reasoning RM + Self-Rubric 2026.04		64.2
Base Model 2026.04		56.1