Share your thoughts, 1 month free Claude Pro on usSee more

Multi-label Safety Categorization on HarmBench prompts

0.5432Macro Accuracy

Opir-multitask-large

Updated 1mo ago

Evaluation Results

Method	Links
Opir-multitask-large 2026.05		0.5432
Opir-multitask-multilang 2026.05		0.4828
Gliner-Guard-Omni 2026.05		0.2986
GLiGuard 2026.05		0.171