Share your thoughts, 1 month free Claude Pro on usSee more

Proactive Dialogue Evaluation on DuRecDial ID 2.0 (test)

3.86Proactivity

Qwen 14B

Updated 2mo ago

Evaluation Results

Method	Links
Qwen 14B 2026.05		3.86	4.91	4.85	3.83
Qwen 32B 2026.05		3.86	4.91	4.85	4.01
LLaMA 8B 2026.05		3.74	4.82	4.73	4.17
Ours 0.3B 2026.05		2.45	4.41	4.3	2.16
Qwen 3B 2026.05		2.21	4.3	4.31	2.05
LLaMA 1B 2026.05		2.12	4.32	4.25	2.07
LLaMA 3B 2026.05		2.08	4.23	4.18	1.98