Share your thoughts, 1 month free Claude Pro on usSee more

Safety Classification on GuardSet (test)

96.26Accuracy (Harmless)

GPT-4o-mini

Updated 3mo ago

Evaluation Results

Method	Links
GPT-4o-mini 2026.04		96.26	80.06	88.16
GPT-4o 2026.04		95.41	87.39	91.4
GuardAdvisor 2026.04		95.08	85.95	90.52
Granite-Guardian 2026.04		92.07	89.06	90.57
WildGuard 2026.04		91.67	89.06	90.37
Llama-Guard-4 2026.04		64.35	94.21	79.28
Llama-Guard-3 2026.04		57.08	96.09	76.59