Share your thoughts, 1 month free Claude Pro on usSee more

Verifiable Instruction Following on IFEval (test)

75.23Prompt Loose Accuracy

LLAMA-3.1-TULU-3-8B-DPO

Updated 4mo ago

Evaluation Results

Method	Links
LLAMA-3.1-TULU-3-8B-DPO 2025.12		75.23
QWEN2.5-7B-INSTRUCT 2025.12		73.01
LLAMA-3.1-8B-INSTRUCT 2025.12		71.72
STACKELBERGGDA-LEADER 2025.12		71.71
GEMMA-2-9B-IT 2025.12		71.53
LLAMA-3.1-TULU-3-8B-SFT 2025.12		67.46
STACKELBERGGDA-FOLLOWER 2025.12		61.92