Share your thoughts, 1 month free Claude Pro on usSee more

Common Sense Reasoning on Six Benchmarks Suite (ARC-e, PIQA, OpenbookQA, Winogrande, HellaSwag, MathQA)

61Average Accuracy

Original

Updated 3mo ago

Evaluation Results

Method	Links
Original 2026.04		61
Original 2026.04		57
Swift-SVD 2026.04		56
Swift-SVD* 2026.04		56
Swift-SVD* 2026.04		55
Swift-SVD 2026.04		54
SVD-LLM (W) 2026.04		53
Original 2026.04		52
Swift-SVD* 2026.04		51
Swift-SVD 2026.04		50
SVD-LLM (W) 2026.04		42
SVD-LLM (W) 2026.04		41
ASVD 2026.04		36
ASVD 2026.04		32
ASVD 2026.04		32