Share your thoughts, 1 month free Claude Pro on usSee more

Prompt Extraction on IHEval Prompt Extraction Alignment 1.0

83.7Accuracy

Llama3.1-8B-NSHA-DPO

Updated 3mo ago

Evaluation Results

Method	Links
Llama3.1-8B-NSHA-DPO 2026.04		83.7
Llama3.1-8B-NS 2026.04		68.5
Qwen3-4B-it-NS 2026.04		65.1
Qwen3-4B-it-NSHA-DPO 2026.04		65.1
Llama3.1-8B-NSHA-HCAL 2026.04		65.1
Qwen3-4B-it 2026.04		64.8
Llama3.1-8B 2026.04		64.5
Qwen3-4B-it-NSHA-HCAL 2026.04		62.6
Llama3.1-8B-CoT 2026.04		60.1
Qwen3-4B-it-CoT 2026.04		58.8
Qwen3-4B-it-NSHA-SFT 2026.04		49.7
Llama3.1-8B-NSHA-SFT 2026.04		34.6