Share your thoughts, 1 month free Claude Pro on usSee more

Opinion Alignment on WoM

75.1Mean Accuracy

SFT+GRPO

Updated 4mo ago

Evaluation Results

Method	Links
SFT+GRPO 2026.03		75.1
SFT+GRPO 2026.03		75.06
SFT 2026.03		72.56
GRPO 2026.03		72.05
SFT+GRPO 2026.03		71.16
SFT 2026.03		68.25
SFT 2026.03		61.74
GRPO 2026.03		60.63
ORPO 2026.03		57.48
GRPO 2026.03		53.19
icl 2026.03		48.67
icl 2026.03		44.64
ORPO 2026.03		38.56
ORPO 2026.03		36.1
random 2026.03		33.33
icl 2026.03		31.44
majority 2026.03		27.44