Share your thoughts, 1 month free Claude Pro on usSee more

Zero-shot Commonsense Reasoning on PIQA, HellaSwag, WinoGrande, ARC-Easy, OpenBookQA, and MathQA (test)

59Zero-shot Accuracy

Original

Updated 2mo ago

Evaluation Results

Method	Links
Original 2026.05		59
Original 2026.05		56
ZS-SVD 2026.05		56
IO-SVD 2026.05		56
SVDLLM 2026.05		55
ZS-SVD 2026.05		54
ASVD 2026.05		54
IO-SVD 2026.05		53
Original 2026.05		52
ZS-SVD 2026.05		51
IO-SVD 2026.05		51
SVDLLM 2026.05		51
FWSVD 2026.05		43
SVDLLM 2026.05		41
ASVD 2026.05		33
ASVD 2026.05		32
SVD 2026.05		21
FWSVD 2026.05		9
FWSVD 2026.05		6
SVD 2026.05		5
SVD 2026.05		3