Share your thoughts, 1 month free Claude Pro on usSee more

Prompt classification on Aegis

91.5F1 Score

Stage3-DPO

Updated 17d ago

Evaluation Results

Method	Links
Stage3-DPO 2026.07		91.5
Qwen3Guard-Gen 2026.07		91.4
Stage1-SFT-v0 2026.07		91.3
Qwen3Guard-8B-Gen 2026.07		91.2
Stage1-SFT-v1 2026.07		91
Qwen3Guard-Gen 2026.07		90.8
Qwen3Guard-Gen 2026.07		90.8
Qwen3Guard-0.8B-Gen 2026.07		90.6
Qwen3Guard-4B-Gen 2026.07		90.6
PolyGuard-Qwen 2026.07		90.3
Stage1-SFT-v3 2026.07		90.2
NemotronReasoning 2026.01		89.6
PolyGuard 2026.01		89.6
YuFeng-XGuard 2026.01		89.6
WildGuard 2026.07		89.4
NExT-Guard 2026.02		88.9
Qwen3Guard-Gen 2026.01		88.7
NExT-Guard* 2026.02		88.5
YuFeng-XGuard 2026.01		88.3
HaloGuard 1.0 2026.07		88
Qwen3Guard-Gen 2026.01		87.9
WildGuard-7B 2026.02		87.9
WildGuard 2026.01		87.6
Stage2-SFT 2026.07		87.6
Stage1-SFT-v2 2026.07		87.5
Qwen3Guard-Gen 2026.01		87.4
YuFeng-XGuard-Reason-0.6B 2026.07		87
YuFeng-XGuard-Reason-8B 2026.07		86.9
HaloGuard 1.0 2026.07		86.7
Stage1-SFT-v4 2026.07		85
GPT-OSS-SafeGuard 2026.01		84.3
NemotronGuardV2 2026.01		82.2
Qwen3Guard-Gen 2026.01		82.1
Qwen3Guard-Gen 2026.01		81.8
NemoGuard 2026.07		81.4
Qwen3Guard-Gen 2026.01		81.2
NemoGuard-8B 2026.02		80.8
ShieldGemma 2026.01		79.8
Llama3Guard 2026.01		77.8
Qwen3Guard-0.6B-Stream 2026.02		76.2
Qwen3Guard-0.6B-Gen 2026.02		75.5
Qwen3Guard-8B-Gen 2026.02		75
Qwen3Guard-4B-Gen 2026.02		74.9
Qwen3Guard-8B-Stream 2026.02		74.9
Qwen3Guard-4B-Stream 2026.02		74.3
SCM-7B 2026.02		73.8
Kelp 2026.02		73.5
Llama4Guard 2026.01		72.2
LlamaGuard3-8B 2026.02		70.3
ShieldGemma 2026.07		69
ShieldGemma-9B 2026.02		68.9
ShieldGemma-27B 2026.02		68.1
LlamaGuard4 2026.07		67.8
LlamaGuard4-12B 2026.02		66.5