Mix

Benchmarks

Task Name	Dataset Name	SOTA Result
Multi-hop Question Answering	Mix	F1 Score79.69	14
Retrieval-Augmented Generation	Mix	Comprehensiveness95.9	12
Explanatory QA	Mix (test)	EM76.5	10
Question Answering	Mix	F150.6	9
Graph-level Anomaly Detection	MIX	AUC0.6377	8
Drivable Area Segmentation	MIX Gazebo+GMRPD (test)	Mean IoU98.97	8
Robustness Prediction	MIX (Dynamic)	Mean Error0.0006	8
Robustness Prediction	MIX (Static)	Mean Error0.0047	8
Federated Graph Classification	Mix across-domain setting	Communication Rounds3	8
Retrieval	Mix	Recall@30.66	7
Visual Question-Answering	Mix dataset	Accuracy (Mix)64.93	3
Deepfake Detection	MIX ALL	Accuracy97.83	1

Showing 12 of 12 rows