M-IDoL: Information Decomposition for Modality-Specific and Diverse Representation Learning in Medical Foundation Model

About

Medical foundation models (MFMs) aim to learn universal representations from multimodal medical images that can generalize effectively to diverse downstream clinical tasks. However, most existing MFMs suffer from information ambiguity that blends multimodal representations in a single embedding space, leading to the degradation of modality specificity and diversity. In this paper, we propose M-IDoL, a self-supervised MFM that introduces Information Decomposition for multimodal representation Learning via two objectives: i) maximizing inter-modality entropy by dispersing multimodal representations into separable Mixture-of-Experts (MoE) subspaces to achieve representation specificity across modalities; and ii) minimizing intra-modality uncertainty by performing fine-grained semantic discrimination within each MoE subspace to enrich representation diversity per modality. By pre-training on 1.15 million medical images, M-IDoL i) delivers superior generalization across 21 downstream clinical tasks, outperforming 20 foundation models on five imaging modalities (e.g., X-ray, fundus, OCT, dermoscopy and pathology), and ii) learns modality-specific and diverse representations, showing clearer separation of feature clusters across modalities and finer-grained feature discrimination within each modality.

Yihang Liu, Longzhen Yang, Jiaxiong Yang, Ying Wen, Lianghua He, Heng Tao Shen• 2026

Related benchmarks

Task	Dataset	Result
Classification	Retina	Accuracy88.4	43
Classification	RSNA	Accuracy85.13	38
Segmentation	ISIC 2018	DICE88.59	30
Classification	HAM10000	--	30
Image Classification	HAM10000	Accuracy97.1	27
Image Classification	BreakHis Binary	Accuracy93	14
Image Classification	BreakHis 8C	Accuracy94.15	14
Image Classification	Mitosis (Histopathology)	Accuracy85.33	14
Image Classification	CXP	AUC90.09	14
Image Classification	ZhangCXR	Accuracy96.68	14

Showing 10 of 34 rows

Other info

Follow for update

@wizwand_team Discord