Share your thoughts, 1 month free Claude Pro on usSee more

Prompt classification on SorryB

97.2F1 Score

PolyGuard

Updated 4mo ago

Evaluation Results

Method	Links
PolyGuard 2026.01		97.2
Qwen3Guard-Gen 2026.01		95.1
Qwen3Guard-Gen 2026.01		94.3
Qwen3Guard-Gen 2026.01		93.6
YuFeng-XGuard 2026.01		93.2
Qwen3Guard-Gen 2026.01		91.2
YuFeng-XGuard 2026.01		91.2
Qwen3Guard-Gen 2026.01		90.4
WildGuard 2026.01		90
NemotronReasoning 2026.01		88.8
Qwen3Guard-Gen 2026.01		88.4
GPT-OSS-SafeGuard 2026.01		88
Llama3Guard 2026.01		87.1
NemotronGuardV2 2026.01		78.4
Llama4Guard 2026.01		73.2
ShieldGemma 2026.01		63.9