SOTA OOD safety category inference (Stage 2) on OpenAI Moderation and PapersWithCode

36.45Mean Reward

Gemini2.5-Flash

Updated 4mo ago

Evaluation Results