Share your thoughts, 1 month free Claude Pro on usSee more

Jailbreak Robustness on AutoRAN

0Harmfulness Rate

RealSafe-R1

Updated 2mo ago

Evaluation Results

Method	Links
RealSafe-R1 2025.08		0
SafeKey 2025.08		0
ThinkingI 2025.08		0
SAFEPATH-ZS 2025.08		0
ReasoningGuard 2025.08		0
No Defense 2025.08		0
RealSafe-R1 2025.08		0
SAFEPATH-ZS 2025.08		0
ReasoningGuard 2025.08		0
No Defense 2025.08		2
Self-Reminder 2025.08		2
SmoothLLM 2025.08		2
Paraphrase 2025.08		2
Self-Reminder 2025.08		4
SmoothLLM 2025.08		4
Paraphrase 2025.08		6
ThinkingI 2025.08		6