Share your thoughts, 1 month free Claude Pro on usSee more

Argument Quality Evaluation on WebisArgQuality 20

41.08F1 Score

Qwen3-4B-ArgumentOnly-Target-SFT

Updated 4mo ago

Evaluation Results

Method	Links
Qwen3-4B-ArgumentOnly-Target-SFT 2026.03		41.08
Qwen3-4B-Arguinas-Target-SFT 2026.03		41.01
Qwen3-4B-Target-SFT 2026.03		39.37
Qwen3-8B-EntailmentBank-Target-SFT 2026.03		38.96
Qwen3-4B-AAAC-Target-SFT 2026.03		38.58
Qwen3-4B-EntailmentBank-Target-SFT 2026.03		38
Qwen3-8B-Arguinas-Target-SFT 2026.03		37.77
Qwen3-8B-AAAC-Target-SFT 2026.03		37.67
Qwen3-4B-Instruct-Arguinas-SFT 2026.03		36.43
Qwen3-8B-ArgumentOnly-Target-SFT 2026.03		35.27
Qwen3-8B-Target-SFT 2026.03		34.97
Qwen3-4B-Instruct 2026.03		34.68
Qwen2.5-7B-Instruct-Arguinas-SFT 2026.03		33.82
Qwen2.5-7B-Instruct 2026.03		22.35