Share your thoughts, 1 month free Claude Pro on usSee more

Preference Labeling on Anthropic Harmlessness

77Preference Labeling Accuracy

Curriculum-RLAIF

Updated 3mo ago

Evaluation Results

Method	Links
Curriculum-RLAIF 2025.05		77
Conventional RLAIF 2025.05		71
Curriculum-RLAIF 2025.05		68
RLCD 2025.05		65
RLCD 2025.05		61
Conventional RLAIF 2025.05		59
CAI 2025.05		57
CAI 2025.05		55