Share your thoughts, 1 month free Claude Pro on usSee more

Prompt Extraction on IHEval Prompt Extraction - Conflict 1.0

59.6Accuracy

Qwen3-4B-it-NSHA-SFT

Updated 3mo ago

Evaluation Results

Method	Links
Qwen3-4B-it-NSHA-SFT 2026.04		59.6
Llama3.1-8B-NSHA-SFT 2026.04		36.3
Qwen3-4B-it 2026.04		25.6
Qwen3-4B-it-NS 2026.04		25.5
Qwen3-4B-it-NSHA-HCAL 2026.04		24
Qwen3-4B-it-NSHA-DPO 2026.04		20.3
Llama3.1-8B-NSHA-DPO 2026.04		17.5
Qwen3-4B-it-CoT 2026.04		15.9
Llama3.1-8B-NSHA-HCAL 2026.04		12.1
Llama3.1-8B 2026.04		11.3
Llama3.1-8B-NS 2026.04		11.3
Llama3.1-8B-CoT 2026.04		11