Share your thoughts, 1 month free Claude Pro on usSee more

Error Detection on CoSPlan Robo-VQA-E

45.3Accuracy

GPT-4o

Updated 1mo ago

Evaluation Results

Method	Links
GPT-4o 2025.12		45.3
GPT-4o 2025.12		44.2
CoG-VLM 2025.12		35.3
CoG-VLM 2025.12		33.4
CoG-VLM 2025.12		32.1
Janus-pro-7B 2025.12		26.1
Intern-VLM 2025.12		26.1
Random 2025.12		25.4
Intern-VLM 2025.12		25.2
Intern-VLM 2025.12		24.3
Janus-pro-7B 2025.12		18.1
Janus-pro-7B 2025.12		17.5
Qwen2 VL-8B 2025.12		9.6
Qwen2 VL-8B 2025.12		9.2
Qwen2 VL-8B 2025.12		9.1