Share your thoughts, 1 month free Claude Pro on usSee more

Reward Modeling on RM-Bench Normal

80Accuracy

INF-ORM-Llama3.1-70B

Updated 3mo ago

Evaluation Results

Method	Links
INF-ORM-Llama3.1-70B 2026.02		80
WILDREWARD-8B 2026.02		78.4
WILDREWARD-4B 2026.02		77
Athene-RM-8B 2026.02		76.6
Llama-3.1-Nemotron-70B 2026.02		76.5
Skywork-Reward-Llama-3.1-8B-v0.2 2026.02		74.2
Internlm2-20b-reward 2026.02		74.2
Llama-3-OffsetBias-RM-8B 2026.02		73.2
Skywork-Reward-Gemma-2-27B-v0.2 2026.02		71.9
ArmoRM-Llama3-8B-v0.1 2026.02		71.5