Share your thoughts, 1 month free Claude Pro on usSee more

Utility Evaluation on GPQA Diamond

53Accuracy (pass@1)

No Defense

Updated 2mo ago

Evaluation Results

Method	Links
No Defense 2025.08		53
SAFEPATH-FT 2025.08		53
ReasoningGuard 2025.08		53
SafeDecoding 2025.08		52
Self-Reminder 2025.08		52
No Defense 2025.08		52
ThinkingI 2025.08		50
SafeKey 2025.08		49
SafeDecoding 2025.08		48
RealSafe-R1 2025.08		46
SAFEPATH-ZS 2025.08		46
SAFEPATH-FT 2025.08		45
SAFEPATH-ZS 2025.08		45
RealSafe-R1 2025.08		44
Self-Reminder 2025.08		44
ReasoningGuard 2025.08		44
SafeKey 2025.08		41
ThinkingI 2025.08		41
SmoothLLM 2025.08		34
SmoothLLM 2025.08		31
Paraphrase 2025.08		23
Paraphrase 2025.08		20