Share your thoughts, 1 month free Claude Pro on usSee more
WorkDL logo mark

Natural Language Inference on SICK

91.58Accuracy

Individual Task

43.916856.290968.66581.0391Jun 4, 2021Apr 3, 2022Jan 31, 2023Nov 30, 2023Sep 28, 2024Jul 28, 2025May 28, 2026
Updated 5d ago

Evaluation Results

MethodLinks
2026.04
91.58--
2026.03
90.9--
2026.04
88.47--
2023.05
88.1--
2026.04
87.92--
2021.06
87.2--
2026.04
86.45--
2021.06
86.2--
2026.04
84.92--
2026.04
84.56--
2026.04
83.88--
2026.04
82.12--
2026.04
81.74--
2026.04
81.37--
2026.04
80.6--
2023.05
78--
2023.05
75.2--
2023.05
74.3--
2026.04
73.99--
2026.04
71.14--
2026.05
70.84--
2026.05
70.75--
2026.05
70.51--
2026.05
70.29--
2026.05
70.14--
2026.05
70.13--
2026.05
69.93--
2026.05
69.92--
2026.05
69.87--
2026.05
69.66--
2026.05
69.53--
2026.05
69.47--
2026.05
69.09--
2026.05
68.94--
2026.05
68.93--
2026.05
68.91--
2026.05
68.88--
2026.05
68.85--
2026.05
68.82--
2026.05
68.33--
2026.05
68.19--
2026.05
68.17--
2026.05
68.15--
2026.05
67.76--
2026.05
67.69--
2026.05
67.5--
2026.05
67.41--
2026.05
67.23--
2026.05
67.08--
2026.05
67.04--
2026.05
67--
2026.05
67--
2026.05
66.92--
2026.05
66.74--
2026.05
66.62--
2026.05
66.57--
2026.05
66.43--
2026.05
66.11--
2026.05
65.72--
2026.05
65.09--
2026.05
65.08--
2026.05
64.98--
2026.05
64.69--
2026.05
64.3--
2026.05
63.34--
2026.05
62.56--
2026.05
62.36--
2026.05
62.07--
2026.05
61.5--
2026.05
60.66--
2023.05
60.5--
2026.05
59.35--
2026.05
59.33--
2026.05
59.07--
2022.11
58.18--
2022.11
56.23--
2022.11
55.76--
2022.11
55.69--
2022.11
55.49--
2022.11
53.67--
2022.11
53.46--
2026.05
52.97--
2022.11
51.91--
2026.05
51.86--
2026.05
45.75--
2023.05
-25.6-
2023.05
-41.1-
2023.05
-41.4-
2026.03
--83.8
2026.03
--86.6
2026.03
--86.6
2026.03
--80
2026.03
--83.8
2026.03
--80.2
2026.03
--80.1
2026.03
--86.1
2026.03
--76.6
2026.03
--80.3
2026.03
--83
2026.03
--89.2
Showing 100 of 101 rows