Share your thoughts, 1 month free Claude Pro on usSee more

Open-domain Reasoning on ARC-c

84.6Pass@1

TRAPO

Updated 5mo ago

Evaluation Results

Method	Links
TRAPO 2025.12		84.6
TRAPO 2025.12		83.7
Fully Supervised 2025.12		82.3
Fully Supervised 2025.12		82.1
TTRL 2025.12		80.5
Sentence-level Entropy 2025.12		79.4
Sentence-level Entropy 2025.12		79.4
Fully Supervised 2025.12		76.2
Token-level Entropy 2025.12		75.6
Self-certainty 2025.12		72.9
Token-level Entropy 2025.12		72.9
TTRL 2025.12		72.6
Qwen-Instruct 2025.12		70.3
Self-certainty 2025.12		64.8
Qwen-Base 2025.12		18.2