A Unified Debiasing Approach for Vision-Language Models across Modalities and Tasks

About

Recent advancements in Vision-Language Models (VLMs) have enabled complex multimodal tasks by processing text and image data simultaneously, significantly enhancing the field of artificial intelligence. However, these models often exhibit biases that can skew outputs towards societal stereotypes, thus necessitating debiasing strategies. Existing debiasing methods focus narrowly on specific modalities or tasks, and require extensive retraining. To address these limitations, this paper introduces Selective Feature Imputation for Debiasing (SFID), a novel methodology that integrates feature pruning and low confidence imputation (LCI) to effectively reduce biases in VLMs. SFID is versatile, maintaining the semantic integrity of outputs and costly effective by eliminating the need for retraining. Our experimental results demonstrate SFID's effectiveness across various VLMs tasks including zero-shot classification, text-to-image retrieval, image captioning, and text-to-image generation, by significantly reducing gender biases without compromising performance. This approach not only enhances the fairness of VLMs applications but also preserves their efficiency and utility across diverse scenarios.

Hoin Jung, Taeuk Jang, Xiaoqian Wang• 2024

Related benchmarks

Task	Dataset	Result
Text-to-Image Retrieval	Flickr30K	R@178	607
Classification	CelebA	--	197
Text-to-Image Retrieval	COCO 2017	Recall@590.6	43
Image Classification	FACET	Macro F169.2	27
Multi-class classification	FACET	Accuracy53.69	18
Multi-class classification	FACET (test)	Accuracy53.69	15
Text-to-Image Generation	Text-to-Image Generation Evaluation Set	Mismatch Rate (M/F)1.54	12
Image Captioning	MS-COCO	METEOR32.08	8
Zero-shot Classification	FACET	Mean Accuracy56.61	6
Text-to-Image Generation	Bias-in-Bios prompts (83 occupations)	Mismatch Rate (M-F)1.54	6

Showing 10 of 13 rows

Other info

Follow for update

@wizwand_team Discord