Prompt Injection Robustness on Tool calling prompt injections

99Robustness Score

gpt-5-thinking

Updated 4mo ago

Evaluation Results

Method	Links
gpt-5-thinking 2025.12		99
OpenAI o3 2025.12		80