Share your thoughts, 1 month free Claude Pro on usSee more

Argument Quality Evaluation on UKPConvArg 2

92.86Accuracy

Qwen3-8B-Arguinas-Target-SFT

Updated 4mo ago

Evaluation Results

Method	Links
Qwen3-8B-Arguinas-Target-SFT 2026.03		92.86
Qwen3-4B-Arguinas-Target-SFT 2026.03		92.79
Qwen3-4B-AAAC-Target-SFT 2026.03		92.74
Qwen3-8B-ArgumentOnly-Target-SFT 2026.03		92.56
Qwen3-4B-EntailmentBank-Target-SFT 2026.03		92.49
Qwen3-8B-Target-SFT 2026.03		92.49
Qwen3-4B-ArgumentOnly-Target-SFT 2026.03		92.45
Qwen3-4B-Target-SFT 2026.03		92.35
Qwen3-8B-AAAC-Target-SFT 2026.03		92.12
Qwen3-8B-EntailmentBank-Target-SFT 2026.03		91.4
Qwen3-4B-Instruct-Arguinas-SFT 2026.03		80.22
Qwen3-4B-Instruct 2026.03		77.66
Qwen2.5-7B-Instruct-Arguinas-SFT 2026.03		77.59
Qwen2.5-7B-Instruct 2026.03		77.45