Share your thoughts, 1 month free Claude Pro on usSee more

Safety Evaluation on WildTeaming 500-example (test)

88.6HarmR

Ft. Agent

Updated 4mo ago

Evaluation Results

Method	Links
Ft. Agent 2025.10		88.6	2.87
Naive RAG 2025.10		88.5	2.84
Base Agent 2025.10		87.5	2.9
Naive RAG 2025.10		87.3	2.97
Ft. Agent 2025.10		87.3	2.88
Base LLM 2025.10		87	2.84
Base Agent 2025.10		83.9	2.79
Base LLM 2025.10		81.7	2.73
Naive RAG 2025.10		77.4	2.45
Base Agent 2025.10		69.1	2.43
Base LLM 2025.10		68.5	2.4
Base LLM 2025.10		56.3	3.29
Naive RAG 2025.10		54.9	3.17
Base Agent 2025.10		54.9	3.17