Share your thoughts, 1 month free Claude Pro on usSee more

Helpfulness Evaluation on Helpfulness

97Average Win Rate

Curriculum-RLAIF

Updated 3mo ago

Evaluation Results

Method	Links
Curriculum-RLAIF 2025.05		97
Curriculum-RLAIF 2025.05		95
Internal Eval. 2025.05		94
Curriculum-RLAIF 2025.05		93
Conventional RLAIF 2025.05		93
Implicit Eval. (DPO) 2025.05		93
RLCD 2025.05		92
Internal Eval. 2025.05		91
External Eval. 2025.05		91
Conventional RLAIF 2025.05		90
Implicit Eval. (DPO) 2025.05		90
CAI 2025.05		89
Internal Eval. 2025.05		88
RLCD 2025.05		88
RLCD 2025.05		87
External Eval. 2025.05		87
CAI 2025.05		87
External Eval. 2025.05		87
Conventional RLAIF 2025.05		86
CAI 2025.05		85
Implicit Eval. (DPO) 2025.05		85