Share your thoughts, 1 month free Claude Pro on usSee more

Preference Labeling on Anthropic Helpfulness

81Preference Labeling Accuracy

Curriculum-RLAIF

Updated 3mo ago

Evaluation Results

Method	Links
Curriculum-RLAIF 2025.05		81
RLCD 2025.05		77
Conventional RLAIF 2025.05		76
Curriculum-RLAIF 2025.05		72
Conventional RLAIF 2025.05		69
RLCD 2025.05		67
CAI 2025.05		62
CAI 2025.05		58