Share your thoughts, 1 month free Claude Pro on usSee more

Reasoning on FLenQA 2000 tokens

52.5Accuracy

LIME+1

Updated 4mo ago

Evaluation Results

Method	Links
LIME+1 2025.12		52.5
LIME+1 2025.12		52.5
LIME+1 2025.12		52.5
LIME 2025.12		44.3
LIME 2025.12		44.3
LIME 2025.12		44.3
Base 2025.12		40.3
Baseline 2025.12		40.3
Base (DCLM-BASELINE) 2025.12		40.3