RAG Evaluation Datasets

Benchmarks

Task Name	Dataset Name	SOTA Result	Trend
Membership Inference Attack Defense	RAG Evaluation Datasets (NQ, PubMedQA, TriviaQA)	Contextual Recall49.7		7
Poisoning Defense	RAG Evaluation Datasets NQ, PubMedQA, TriviaQA	Contextual Recall59.4		7

Showing 2 of 2 rows