Share your thoughts, 1 month free Claude Pro on usSee more

Robustness Evaluation on LLMBar

83.07Accuracy

Qwen3-30B-A3B-Thinking-2507

Updated 4mo ago

Evaluation Results

Method	Links
Qwen3-30B-A3B-Thinking-2507 2026.01		83.07
QwQ-32B 2026.01		79.31
DeepSeek-R1 2026.01		79
Qwen3-Next-80B-A3B-Thinking 2026.01		77.55
DeepSeek-V3 2026.01		76.49
Qwen2.5-32B-Instruct 2026.01		67.71
Qwen3-Next-80B-A3B-Instruct 2026.01		64.55
Qwen3-30B-A3B-Instruct-2507 2026.01		59.25