Share your thoughts, 1 month free Claude Pro on usSee more

Illicit Task Completion on AgentHarm English prompts

72.7AgentHarm Score (AHS)

STING

Updated 1mo ago

Evaluation Results

Method	Links
STING 2026.02		72.7
STING 2026.02		67.8
STING 2026.02		61.8
STING 2026.02		57.2
STING 2026.02		50.9
STING 2026.02		47.6
Single-turn prompting 2026.02		45.9
Single-turn prompting 2026.02		35.1
STING 2026.02		34.1
STING 2026.02		32.3
Single-turn prompting 2026.02		31.2
STING 2026.02		29.7
STING 2026.02		28
X-Teaming 2026.02		27
Single-turn prompting 2026.02		24.3
Single-turn prompting 2026.02		16
X-Teaming 2026.02		15.1
X-Teaming 2026.02		13.8
X-Teaming 2026.02		5
X-Teaming 2026.02		2.2