Share your thoughts, 1 month free Claude Pro on usSee more

Multi-modal Question Answering on MMStar (test)

72.7Accuracy

Proprietary API SOTA (SenseTime, 2024)

Updated 2mo ago

Evaluation Results

Method	Links
Proprietary API SOTA (SenseTime, 2024) 2025.01		72.7
Open-Source SOTA (Chen et al., 2024d) 2025.01		63.2
IXC-2.5 2025.01		59.9
IXC-2.5-Chat 2025.01		59.6
PivotMerge 2026.04		27.5
TSV-M 2026.04		27.3
CC12M Split 5 2026.04		26.7
CC12M Split 3 2026.04		26.5
CC12M Split 2 2026.04		25.7
Task Arithmetic 2026.04		25.7
TIES Merging 2026.04		25.1
Weight Average 2026.04		23.9
TIES w/ DARE 2026.04		23.7
MetaGPT 2026.04		23.3
CC12M Split 4 2026.04		22.9
CC12M Split 1 2026.04		20
Iso-C 2026.04		13.5