Our new X account is live! Follow @wizwand_team for updates

Reasoning on MuSR

71.89Accuracy

LLaDA2.1-mini

Updated 4d ago

Evaluation Results

Method	Links
LLaDA2.1-mini 2026.02		71.89	1.56
LLaDA2.0-mini 2026.02		71.48	1.45
Ling-mini-2.0 2026.02		71.36	-
LLaDA2.1-mini 2026.02		70.43	2.48
Qwen3-8B 2026.02		70.02	-
Qwen3-4B 2026.02		55.46	-
Qwen3-4B 2026.02		54.14	-
Qwen3-8B 2026.02		53.5	-
Qwen3-8B 2026.02		49.78	-
LLaMA3.1-8B 2026.02		46.17	-
LLaMA3.1-8B 2026.02		44.87	-