Share your thoughts, 1 month free Claude Pro on usSee more

Multimodal Autoformalization on PHYX Electromagnetism

0.667Compile Success Rate

GPT-5

Updated 4mo ago

Evaluation Results

Method	Links
GPT-5 2026.01		0.667	0.5	0.5
GPT-5 2026.01		0.5	0	-
Gemini-3-Pro 2026.01		0.167	0.333	0.333
Gemini-3-Pro 2026.01		0.167	0	-
Gemini-2.5-Pro 2026.01		0	0	0
Gemini-2.5-Pro 2026.01		0	0	-
Qwen3-VL-235B 2026.01		0	0	0
Qwen3-VL-235B 2026.01		0	0	-
Qwen2.5-VL-72B 2026.01		0	0	0
Qwen2.5-VL-72B 2026.01		0	0	-