Share your thoughts, 1 month free Claude Pro on usSee more

Image-to-Text Retrieval on COCO 2017 (val)

66Recall@1

SmartCLIP

Updated 3mo ago

Evaluation Results

Method	Links
SmartCLIP 2025.07		66	86.2	92.6
Long-CLIP 2025.07		62.8	85.1	91.2
SmartCLIP 2025.07		61.9	83.3	89.7
Long-CLIP 2025.07		57.6	81.1	87.8
CLIP 2025.07		56.1	79.5	86.8
CLIP 2025.07		51.8	76.8	84.3
CLIP-Refine 2025.04		38.78	65.04	75.12
Direct Fine-tuning 2025.07		37.9	63.1	72.2
HyCD 2025.04		37.88	62.54	72.84
Direct Fine-tuning 2025.07		37.4	62.3	72.1
Self-KD 2025.04		35.36	59	69.72
HyCD + Lalign 2025.04		35.14	61.74	72.06
Pre-trained (CLIP) 2025.04		33.26	59.1	68.78
m²-mix 2025.04		32.92	57.96	67.56
Contrastive 2025.04		31.86	56.8	67.48