Share your thoughts, 1 month free Claude Pro on usSee more

Utility Evaluation on MMLU (pass@1 Accuracy)

78Accuracy (pass@1)

SafeDecoding

Updated 2mo ago

Evaluation Results

Method	Links
SafeDecoding 2025.08		78
ReasoningGuard 2025.08		74
No Defense 2025.08		73
SafeKey 2025.08		73
Self-Reminder 2025.08		73
ThinkingI 2025.08		73
SAFEPATH-FT 2025.08		72
No Defense 2025.08		69
SafeDecoding 2025.08		69
RealSafe-R1 2025.08		69
SAFEPATH-ZS 2025.08		69
SafeKey 2025.08		67
Self-Reminder 2025.08		67
ThinkingI 2025.08		66
RealSafe-R1 2025.08		66
ReasoningGuard 2025.08		65
SAFEPATH-ZS 2025.08		63
SAFEPATH-FT 2025.08		59
SmoothLLM 2025.08		43
SmoothLLM 2025.08		42
Paraphrase 2025.08		38
Paraphrase 2025.08		30