Share your thoughts, 1 month free Claude Pro on usSee more
WorkDL logo mark

Reward Modeling Accuracy on RewardBench

97.8Accuracy

Skywork-Reward-V2-Llama-3.1-8B-40M

86.25689.25392.2595.247May 5, 2025Jun 30, 2025Aug 25, 2025Oct 21, 2025Dec 16, 2025Feb 10, 2026Apr 8, 2026
Updated 8d ago

Evaluation Results

MethodLinks
2025.07
97.8
2025.07
96.4
2026.02
95.1
2026.02
95.1
2025.07
95.1
2025.05
95.1
2026.03
95.1
2026.02
95
2025.07
95
2025.07
94.4
2026.02
94.3
2026.02
94.3
2025.07
94.3
2026.02
93.9
2026.02
93.9
2025.07
93.9
2025.07
93.9
2026.02
93.8
2025.07
93.8
2025.07
93.8
2025.05
93.8
2025.07
93.7
2025.07
93.4
2026.02
93.3
2025.07
93.3
2025.05
93.3
2026.03
93.3
2026.02
93.1
2026.02
93.1
2025.07
93.1
2025.07
93.1
2025.07
93.1
2025.07
93
2025.07
92.9
2025.07
92.9
2026.02
92.8
2026.03
92.8
2025.07
92.5
2025.05
92.5
2026.03
92.5
2026.03
92.5
2026.02
92.4
2026.02
92
2025.05
92
2026.03
92
2025.07
91.5
2025.05
91.4
2026.03
91.4
2026.02
91.3
2026.03
91
2025.07
90.9
2025.05
90.9
2026.02
90.5
2026.02
90.4
2026.02
90.4
2026.02
90.4
2025.07
90.4
2025.07
90.4
2025.05
90.4
2026.03
90.4
2026.03
90.4
2025.07
90.3
2026.02
90.2
2026.02
90.2
2026.02
90.2
2025.07
90.2
2025.05
90.2
2025.05
90.2
2026.03
90.2
2025.07
89.9
2026.02
89.3
2026.02
89.3
2026.02
89.1
89
2026.02
89
2026.02
89
2025.07
89
2026.02
88.9
2025.05
88.9
2025.05
88.8
2026.03
88.8
2026.03
88.8
2025.07
88.5
2025.07
88.5
2026.04
88.5
2025.05
88.2
2025.05
88.2
2026.02
87.8
2025.07
87.6
2025.05
87.6
2026.02
87.3
2026.02
87.1
2026.02
87.1
2025.05
87.1
2026.02
86.9
2026.02
86.8
2026.02
86.7
2026.02
86.7
2025.07
86.7
2025.05
86.7
Showing 100 of 166 rows