Share your thoughts, 1 month free Claude Pro on usSee more

Instruction Following Evaluation on IFEval Inverse

83.7Accuracy

Qwen3-30B

Updated 2mo ago

Evaluation Results

Method	Links
Qwen3-30B 2025.10		83.7
Qwen3-4B 2025.10		76.1
GLM-4-9B 2025.10		74.2
GPT-5.2 2025.10		73.7
Gemini-3-Flash 2025.10		70.6
Gemma-3-4B 2025.10		69.8
Claude-4.5-Sonnet 2025.10		67.2
Tulu-3.1-8B 2025.10		65.3
Qwen3-30B 2025.10		56.8
Qwen3-4B 2025.10		51.2
Qwen3-30B 2025.10		49.2
GLM-4-9B 2025.10		48.5
Qwen3-4B 2025.10		44.7
Gemma-3-4B 2025.10		43.7
GLM-4-9B 2025.10		42.1
Tulu-3.1-8B 2025.10		40.2
Gemma-3-4B 2025.10		38.5
Tulu-3.1-8B 2025.10		32.8