Share your thoughts, 1 month free Claude Pro on usSee more

Harmful Meme Detection on MAMI (test)

84.86Accuracy

GPT-5-mini

Updated 1mo ago

Evaluation Results

Method	Links
GPT-5-mini 2026.05		84.86	84.86
GPT-5-mini 2026.05		82.2	82.14
Qwen-3 2026.05		81.9	81.8
GPT-4.1-mini 2026.05		81.9	81.8
GPT-4o 2025.07		81	81
Pixtral 2026.05		80.7	80.7
Qwen-3 2026.05		80.4	80.19
Qwen-3 2026.05		80.2	80.2
U-CoT+ 2026.05		79.9	79.89
Qwen-3 2026.05		79.6	79.59
Qwen-3 2026.05		79.4	78.89
Qwen-3 2026.05		79.1	79.1
Qwen-3 2026.05		79	79
Qwen-3 2026.05		78.7	78.64
Pixtral 2026.05		78.5	78.14
GPT-4.1-mini 2026.05		78.3	77.98
InternVL-3.5 2026.05		78.1	77.69
InternVL-3.5 2026.05		78.1	77.68
Qwen-3 2026.05		77.6	77.49
Pixtral 2026.05		76.67	76.39
Gemini 1.5 Flash 2025.07		76.4	74.29
Pixtral 2026.05		76	75.19
InternVL-3.5 2026.05		76	75.98
Qwen-3 2026.05		75.6	75.57
Pixtral 2026.05		75.3	75.16
InternVL-3.5 2026.05		74.6	74.47
InternVL-3.5 2026.05		74.6	74.46
InternVL-3.5 2026.05		74.5	74.35
InternVL-3.5 2026.05		74.3	74.04
InternVL-3.5 2026.05		74.2	74.15
Qwen-3 2026.05		74.1	74.1
Pixtral 2026.05		74	72.87
Pixtral 2026.05		72.91	72.49
InternVL-3.5 2026.05		72.6	71.88
InternVL-3.5 2026.05		72.4	72.16
Qwen-3 2026.05		72.3	72.29
Pixtral 2026.05		72.2	71.16
InternVL-3.5 2026.05		71.8	71.45
LLaVA-1.6-34B 2025.07		71.3	71.28
InternVL-3.5 2026.05		69.7	67.83
MIND 2025.07		68.9	68.84
Pixtral 2026.05		67.42	63.79
Pixtral 2026.05		65.14	60.57
Pixtral 2026.05		64.23	59.25
Pixtral 2026.05		64.06	59.04
LLaVA-1.5-13B 2025.07		60.1	55.52
InstructBLIP-13B 2025.07		60	57.97
MiniGPT-v2-7B 2025.07		57.4	52.22
OpenFlamingo-9B 2025.07		54.7	49.88
InstructBLIP-7B 2025.07		53.1	46.93
LLaVA-1.5-7B 2025.07		52.9	41.53