Share your thoughts, 1 month free Claude Pro on usSee more

Cultural Commonsense Reasoning on CultureAtlas High Resource

95.9Precision

GPT-4

Updated 4mo ago

Evaluation Results

Method	Links
GPT-4 2026.01		95.9	91.4	93.6
CALM 2026.01		95	90.9	92.4
LLaMA-2 2026.01		86.8	45.6	59.8
Vicuna 2026.01		77.3	47.2	58.6
Vicuna 2026.01		68.9	81	74.5
LLaMA-2 2026.01		56.1	80.9	66.3