Share your thoughts, 1 month free Claude Pro on usSee more

Geometric Problem Solving on GeoTrust Tier2 (test)

24Count

Gemini-2.5-pro

Updated 4mo ago

Evaluation Results

Method	Links
Gemini-2.5-pro 2025.04		24	40
OpenAI-o3 2025.04		24	40
Intern-S1 2025.04		21	35
DeepSeek-R1 2025.04		20	33.33
Claude-3.7-sonnet 2025.04		16	26.67
Qwen2.5-VL-72B 2025.04		15	25
GPT-4o 2025.04		10	16.67
Qwen2-VL-7B 2025.04		2	3.33
LLaVA-1.5-7B 2025.04		1	0.42