Share your thoughts, 1 month free Claude Pro on usSee more

Text-to-Image Retrieval on COCO 2017 (val)

48.5Recall@1

SmartCLIP

Updated 3mo ago

Evaluation Results

Method	Links
SmartCLIP 2025.07		48.5	73.1	81.7
Long-CLIP 2025.07		46.3	70.8	79.8
SmartCLIP 2025.07		42.4	68.2	77.8
Long-CLIP 2025.07		40.4	65.8	75.2
CLIP-Refine 2025.04		37.64	63.54	74.42
m²-mix 2025.04		36.28	62.18	73.08
HyCD 2025.04		36.04	62.28	73.14
CLIP 2025.07		35.4	60.1	70.2
Contrastive 2025.04		34.88	61.5	72.1
HyCD + Lalign 2025.04		33.92	61.18	72.06
CLIP 2025.07		32.7	57.7	68.2
Self-KD 2025.04		31.04	55.58	65.9
Pre-trained (CLIP) 2025.04		30.56	54.92	65.26
Direct Fine-tuning 2025.07		23.1	45.1	55.9
Direct Fine-tuning 2025.07		21.8	43.4	54.5