Share your thoughts, 1 month free Claude Pro on usSee more

Multi-hop Reasoning on Housing QA

82.67Accuracy

TOTAL

Updated 2mo ago

Evaluation Results

Method	Links
TOTAL 2025.10		82.67
CIC + COT 2025.10		75
TOTAL 2025.10		74.33
CIC 2025.10		71.67
CIC + COT 2025.10		70.33
TOTAL 2025.10		70
CIC 2025.10		68.33
CIC + COT 2025.10		66
CIC 2025.10		64.33
COT 2025.10		61.33
NAÏVE 2025.10		60.33
NAÏVE 2025.10		60.33
COT 2025.10		58.67
NAÏVE 2025.10		58
COT 2025.10		57.67