Share your thoughts, 1 month free Claude Pro on usSee more
WorkDL logo mark

Multi-modal Reasoning on EMMA

38.5Accuracy

Qwen2.5-VL-Instruct

7.09215.24623.431.554Oct 2, 2025Nov 10, 2025Dec 19, 2025Jan 27, 2026Mar 7, 2026Apr 15, 2026May 25, 2026
Updated 7d ago

Evaluation Results

MethodLinks
2026.05
38.5--
2026.05
38.1--
2026.05
34.6--
2026.05
33--
2026.01
32.7--
2026.05
32.7--
2025.10
31.9--
2026.05
31.3--
2025.12
30.6--
2026.05
30.5--
2026.05
30.1--
2025.12
29.7--
2026.05
29.7--
2026.05
29.7--
2025.12
29.6--
2026.05
29.6--
2025.10
29.6--
2026.01
29.3--
2026.01
28.6--
2026.05
28.5--
2026.05
28.5--
2026.01
28.4--
2026.05
28.3--
2026.05
27.3--
2025.12
26.9--
2026.05
26.8--
2025.12
26.6--
2026.01
24.8--
2026.05
24.6--
2026.05
24.5--
2026.05
23.6--
2025.12
23.5--
2026.01
22.5--
2025.12
22.4--
2025.12
21.5--
2025.12
21.5--
2026.05
21.5--
2025.10
21.5--
2026.01
21--
2025.12
20.6--
2026.01
20.4--
2026.01
20.3--
2025.12
20.2--
2025.12
19.8--
2026.05
19.8--
2026.05
19.5--
2025.12
19.2--
2026.01
19--
2026.05
18.6--
2025.12
18.3--
2026.05
18.3--
2026.05
18.1--
2026.01
17.8--
2026.05
15--
2026.05
12.1--
2025.12
8.3--
2026.05
8.3--
2026.05
-38.34-
2026.05
-41.34-
2026.05
-39-
2026.05
-36-
2026.05
-42.5-
2026.05
-26.87-
2026.05
-28.5-
2026.05
-27.25-
2026.05
-28.75-
2026.05
-31.25-
2026.05
-23.25-
2026.05
-28.75-
2026.05
-28.75-
2026.05
-30.5-
2026.05
-29-
2026.05
-30.5-
2026.05
-11.75-
2026.05
-20.75-
2026.05
-19-
2026.05
-25.25-
2026.05
-28.75-
2026.05
-38.34-
2026.05
-38.75-
2026.05
-42.25-
2026.05
-43.75-
2026.05
-45.5-
2026.05
--32.7
2026.05
--27.3
2026.05
--38.1
2026.05
--38.5
2026.05
--18.3
2026.05
--21.5
2026.05
--26.5
2026.05
--29.7
2026.05
--8.3
2026.05
--26.6
2026.05
--19.8
2026.05
--18.1
2026.05
--12.1
2026.05
--15
2026.05
--31.3
2026.05
--32.1