WG

Benchmarks

Task Name	Dataset Name	SOTA Result
Common Sense Reasoning	WG	Accuracy94.1	61
Harmful Refusal	WG (test)	ASR0	36
Commonsense Reasoning	WG-S	Accuracy70.9	26
EEG Classification	WG	Accuracy0.7321	6

Showing 4 of 4 rows