Share your thoughts, 1 month free Claude Pro on usSee more

Safety Evaluation on Redteaming Resistance Benchmark (RRB) 919-example subset

5.9HarmR

Base LLM

Updated 4mo ago

Evaluation Results

Method	Links
Base LLM 2025.10		5.9	3.25
Naive RAG 2025.10		9.9	3.29
Base LLM 2025.10		10.5	2.14
Base Agent 2025.10		11.8	2.15
Base Agent 2025.10		12.7	3.1
Base LLM 2025.10		16.2	2.49
Naive RAG 2025.10		21.7	2.2
Base Agent 2025.10		29.1	2.52
Base LLM 2025.10		29.8	2.51
Ft. Agent 2025.10		32.4	2.55
Base Agent 2025.10		39.8	2.6
Naive RAG 2025.10		44.3	2.6
Naive RAG 2025.10		50.9	2.42
Ft. Agent 2025.10		51.4	2.58