Share your thoughts, 1 month free Claude Pro on usSee more

Constraint-following Instruction Evaluation on IFEval

54.4Average Score

LLAMA3-INSTRUCT w/ ULTRAFEEDBACK

Updated 1mo ago

Evaluation Results

Method	Links
LLAMA3-INSTRUCT w/ ULTRAFEEDBACK 2024.10		54.4
LLAMA3-INSTRUCT w/ SSO_DPO 2024.10		53.4
LLAMA3-INSTRUCT w/ PBAA_DPO 2024.10		53.2
LLAMA3-INSTRUCT 2024.10		53
QWEN2-INSTRUCT w/ ULTRAFEEDBACK 2024.10		51.5
QWEN2-INSTRUCT 2024.10		51.4
QWEN2-INSTRUCT w/ SSO_DPO 2024.10		51.4
QWEN2-INSTRUCT w/ PBAA_DPO 2024.10		50.9
LLAMA3-SFT w/ SSO_DPO 2024.10		50.3
LLAMA3-SFT w/ PBAA_DPO 2024.10		47.8
QWEN2-SFT w/ SSO_DPO 2024.10		45.7
LLAMA3-SFT w/ ULTRAFEEDBACK 2024.10		43.6
QWEN2-SFT w/ PBAA_DPO 2024.10		43.6
QWEN2-SFT w/ ULTRAFEEDBACK 2024.10		40.4
LLAMA3-SFT 2024.10		24.9
QWEN2-SFT 2024.10		19.8