Reasoning failure prediction on CodeLingua (L3)

76Accuracy

thought-tree-based classifier

Updated 3mo ago

Evaluation Results

Method	Links
thought-tree-based classifier 2026.04		76
thought-tree-based classifier 2026.04		65