Share your thoughts, 1 month free Claude Pro on usSee more

Multimodal Conversation on LLaVA-Bench Wild

102Score

GPT-4o-0513

Updated 1mo ago

Evaluation Results

Method	Links
GPT-4o-0513 2024.09		102
Gemini-1.5-Pro 2024.09		95.3
LocoRE 2026.01		82.7
Cambrian-34B 2024.09		82
Qwen2.5-VL-32B 2026.01		81.2
Claude3.5-Sonnet 2024.09		81
OneVision 2024.09		81
SGRS + LocoRE 2026.01		80
Ovis1.5-LLAMA3-8B 2024.09		79.9
SGRS + LocoRE 2026.01		79.7
LocoRE 2026.01		77.9
LocoRE 2026.01		77.8
SGRS + LocoRE 2026.01		76.8
Qwen2.5-VL-7B 2026.01		76.8
SGRS + LocoRE 2026.01		76.7
Qwen2-VL-7B 2026.01		75.6
LocoRE 2026.01		74.8
LLaVA-1.5-7B + FarSight 2026.01		74.7
LLaVA-1.5-7B + Vissink 2026.01		74.1
LocoRE 2026.01		74
LLaVA-1.5-7B + TAME 2026.01		73.9
LLaVA-1.5-7B + SID 2026.01		73.4
LLaVA 1.5 + I-MoF 2024.01		73.3
LLaVA 1.5 + I-MoF 2024.01		73.3
InternVL2-8B 2024.09		73.3
LLaVA-1.5-13B 2023.10		72.5
LLaVA-1.5-7B 2026.01		72.5
LLaVA-1.5-13B 2026.01		72.5
LLaVA-1.5-13B-HD 2023.10		72
LLaVA-1.5-7B + OPERA 2026.01		72
LLaVolta 2024.06		71.3
POINTS-7B 2024.09		71.1
LLaVA-13b 2024.06		71
LLaVA-1.5-7B + VCD 2026.01		70.9
LLaVA 1.5 2024.01		70.7
IXC-2.5 2024.09		70.2
LLaVA-1.5-7B + ICD 2026.01		69.7
POINTS-9B 2024.09		69.3
Idefics3-LLAMA3-8B 2024.09		66.3
LLaVA-1.5-7B 2023.10		65.4
LLaVA-7B 2023.10		62.8
LLaVA* 2023.12		62.6
InstructBLIP-8B 2023.10		60.9
SEAL 2023.12		59.1
InstructBLIP-14B 2023.10		58.2
SGRS + LocoRE 2026.01		56.8
SGRS + LocoRE 2026.01		55.5
LocoRE 2026.01		54.1
Intern-VL-13B 2026.01		53.2
LocoRE 2026.01		52.8
Intern-VL-7B 2026.01		51.6
OFA 2026.05		40.8
VisNec 2026.03		39.5
PreSel 2026.03		39.4
PreSel 2026.05		39.4
BLIP2-14B 2023.10		38.1
CoIDO 2026.03		37.6
CoIDO 2026.05		37.6
Full-Data(186K) 2026.03		35.7
Full-Data 2026.05		35.7
ICONS 2026.03		35.4
ICONS 2026.05		35.4
COINCIDE 2026.03		34.6
COINCIDE 2026.05		34.6
XMAS 2026.03		34.2
XMAS 2026.05		34.2
Random 2026.03		33.5
Random 2026.05		33.5
EL2N 2026.03		32.8
EL2N 2026.05		32.8
Self-Filter 2026.03		32.1
Self-Filter 2026.05		32.1
CLIP-Score 2026.03		31.2
CLIP-Score 2026.05		31.2
TypiClust 2026.03		30.4
TypiClust 2026.05		30.4
IFD 2026.03		29.8
IFD 2026.05		29.8