Share your thoughts, 1 month free Claude Pro on usSee more
WorkDL logo mark

Reasoning Quality Correlation Analysis on LIAR

0.2769Somers' D

MarODE(αβ)

-0.0302120.0495190.129250.208981Mar 2, 2026
Updated 1mo ago

Evaluation Results

MethodLinks
2026.03
0.2769
2026.03
0.2762
2026.03
0.2743
2026.03
0.2636
2026.03
0.2618
2026.03
0.2604
2026.03
0.256
2026.03
0.255
2026.03
0.2527
2026.03
0.2427
2026.03
0.2395
2026.03
0.2357
2026.03
0.2164
2026.03
0.2129
2026.03
0.2122
2026.03
0.2103
2026.03
0.2082
2026.03
0.2075
2026.03
0.1386
2026.03
0.1167
2026.03
0.1146
2026.03
0.1075
2026.03
0.1004
2026.03
0.0983
2026.03
0.0776
2026.03
0.0728
2026.03
0.0691
2026.03
0.0417
2026.03
0.0397
2026.03
0.0367
2026.03
0.0358
2026.03
0.0347
2026.03
0.0342
2026.03
0.0286
2026.03
0.0282
2026.03
0.0279
2026.03
0.0253
2026.03
0.0211
2026.03
0.0181
2026.03
0.014
2026.03
0.0084
2026.03
0.0082
2026.03
-0.0073
2026.03
-0.0076
2026.03
-0.0184