Share your thoughts, 1 month free Claude Pro on usSee more

Outcome Reasoning on RNN-Topo

88.9M' F1 Mean

GPT-5

Updated 5mo ago

Evaluation Results

Method	Links
GPT-5 2025.05		88.9	83.4
GPT-o4 2025.05		87.9	81.6
Llama4-M 2025.05		80.5	75
DeepSeek 2025.05		78.3	72
Gemini2.5 2025.05		77.1	70.6
Qwen3 2025.05		75.6	69.4
Llama4-S 2025.05		65.2	58.7