Share your thoughts, 1 month free Claude Pro on usSee more

Physical Commonsense Reasoning on PIQA (Accuracy and Performance Gain)

7,497Accuracy

HPTQ

Updated 4mo ago

Evaluation Results

Method	Links
HPTQ 2025.07		7,497	-
Llama 3.1 8B 2026.01		91	9.7
Llama 3.1 8B 2026.01		90.9	9.7
Mistral Nemo Base 2407 2026.01		89.5	7.3
Mistral Nemo Base 2407 2026.01		89.2	7
Mistral 7B v0.3 2026.01		88.8	7.6
Mistral 7B v0.3 2026.01		88.6	7.4
Llama 3.2 1B 2026.01		88.4	11.7
Llama 3.2 1B 2026.01		88.4	11.7
Qwen3 8B Base 2026.01		88.2	8.8
Qwen3 8B Base 2026.01		87.8	8.3
Qwen3 0.6B 2026.01		82.6	15.9
Qwen3 0.6B 2026.01		82.5	15.8
SSQR-5% 2025.07		80.52	-
BF16 Baseline 2025.07		80.14	-
SSQR-4% 2025.07		79.92	-
SSQR-1% 2025.07		79.65	-
SSQR-3% 2025.07		79.54	-
HPTQ 2025.07		79.49	-
SSQR-2% 2025.07		79.49	-
GPTQ 2025.07		79.27	-
HPTQ 2025.07		79.16	-
SSQR-3% 2025.07		79.11	-
SSQR-5% 2025.07		79.05	-
SSQR-2% 2025.07		78.78	-
SSQR-4% 2025.07		78.73	-
SSQR-1% 2025.07		77.97	-
GPTQ 2025.07		77.37	-
SSQR-3% 2025.07		76.82	-
HPTQ 2025.07		76.55	-
SSQR-2% 2025.07		76.33	-
SSQR-4% 2025.07		76.28	-
BF16 Baseline 2025.07		76.17	-
SSQR-1% 2025.07		76.12	-
GPTQ 2025.07		75.73	-
SSQR-5% 2025.07		75.57	-
SSQR-5% 2025.07		75.52	-
SSQR-3% 2025.07		75.03	-
SSQR-4% 2025.07		75.03	-
SSQR-1% 2025.07		74.92	-
SSQR-2% 2025.07		74.43	-
SSQR-5% 2025.07		72.58	-
GPTQ 2025.07		72.58	-
HPTQ 2025.07		69.15	-
HPTQ 2025.07		69.15	-
SSQR-4% 2025.07		66.49	-
SSQR-3% 2025.07		65.61	-
SSQR-5% 2025.07		65.56	-
SSQR-2% 2025.07		61.04	-
SSQR-2% 2025.07		60.01	-
SSQR-3% 2025.07		58.81	-
SSQR-1% 2025.07		58.49	-
SSQR-1% 2025.07		58.22	-
SSQR-4% 2025.07		54.95	-
GPTQ 2025.07		54.46	-
GPTQ 2025.07		53.65	-