Share your thoughts, 1 month free Claude Pro on usSee more

Spatial-Temporal Reasoning on MMSI

41.8Accuracy

GPT-5

Updated 4mo ago

Evaluation Results

Method	Links
GPT-5 2026.02		41.8
Gemini-2.5-Pro 2026.02		36.9
ReMoT-4b-CoT 2026.02		30.8
GPT-4o 2026.02		30.3
InternVL2.5-8B 2026.02		28.7
Qwen3-VL-30B-CoT 2026.02		28.5
Qwen3-VL-4B-CoT 2026.02		26.8
Qwen2.5-VL-7B 2026.02		25.9
LLaVA-Next-7B 2026.02		24.5