Share your thoughts, 1 month free Claude Pro on usSee more

Harmful content detection on Trolling-oriented generations Llama-3.1 70B

26.04Accuracy

OpenAI Moderation

Updated 3mo ago

Evaluation Results

Method	Links
OpenAI Moderation 2026.04		26.04
Perspective API 2026.04		24.23
LlamaGuard-2 2026.04		11.92
LlamaGuard-1 2026.04		10.51