Instruction Hierarchy Robustness on RealGuardrails Distractors

0.95Score

GPT-5-Mini-R

Updated 4mo ago

Evaluation Results

Method	Links
GPT-5-Mini-R 2026.03		0.95
GPT-5-Mini 2026.03		0.88