SFT-based Poisoning

Benchmarks

Task Name	Dataset Name	SOTA Result
Backdoor Mitigation	SFT-based Poisoning Word trigger	Clean Accuracy (CACC)96.7	18
Backdoor Mitigation	SFT-based Poisoning Phrase trigger	Clean Accuracy (CACC)95.7	18
Backdoor Mitigation	SFT-based Poisoning Long trigger	Clean Accuracy (CACC)94.8	18

Showing 3 of 3 rows