Share your thoughts, 1 month free Claude Pro on usSee more

Geometric Problem Solving on GeoTrust Tier1 (test)

37Count

OpenAI-o3

Updated 4mo ago

Evaluation Results

Method	Links
OpenAI-o3 2025.04		37	61.67
Intern-S1 2025.04		35	58.33
Gemini-2.5-pro 2025.04		34	56.67
Claude-3.7-sonnet 2025.04		33	55
Qwen2.5-VL-72B 2025.04		32	53.33
GPT-4o 2025.04		31	51.67
DeepSeek-R1 2025.04		30	50
Qwen2-VL-7B 2025.04		5	8.33
LLaVA-1.5-7B 2025.04		3	5