Share your thoughts, 1 month free Claude Pro on usSee more

Cultural commonsense reasoning on CultureAtlas Mid Resource

94.9Precision

GPT-4

Updated 4mo ago

Evaluation Results

Method	Links
GPT-4 2026.01		94.9	92.1	93.5
CALM 2026.01		92.5	90.3	91.2
LLaMA-2 2026.01		83.3	42.9	56.6
Vicuna 2026.01		79.4	57.9	67
Vicuna 2026.01		69.4	82.4	75.3
LLaMA-2 2026.01		64.1	75.5	69.3