Reasoning failure prediction on CodeLingua (L1)

73Accuracy

thought-tree-based classifier

Updated 3mo ago

Evaluation Results

Method	Links
thought-tree-based classifier 2026.04		73
thought-tree-based classifier 2026.04		68