Share your thoughts, 1 month free Claude Pro on usSee more

Multimodal Safety Evaluation on Image input safety evaluation set

98.6Hate Safety Acc

gpt-5-thinking-nano

Updated 4mo ago

Evaluation Results

Method	Links
gpt-5-thinking-nano 2025.12		98.6	97.3	98.6	98.6	93.9	96.3
gpt-5-main-mini 2025.12		98.4	98.4	98.2	99.5	99.4	99.8
gpt-5-thinking-mini 2025.12		97.1	98.2	98.6	98.6	98.7	99.2
OpenAI o4-mini 2025.12		92.7	95	95.6	93.9	92.7	97.8