Share your thoughts, 1 month free Claude Pro on usSee more

Code Reasoning on CruxEval Output

51Score

DataFlow-Code-10K

Updated 3mo ago

Evaluation Results

Method	Links
DataFlow-Code-10K 2025.12		51
DataFlow-Code-1K 2025.12		50.9
DataFlow-Code-5K 2025.12		50.6
Self-OSS 2025.12		50.1
Code Alpaca-1K 2025.12		49.6
Qwen2.5-14B-Instruct 2025.12		48.5
Code Alpaca-1K 2025.12		46.4
Self-OSS 2025.12		45.9
DataFlow-Code-10K 2025.12		45.4
DataFlow-Code-1K 2025.12		45.1
DataFlow-Code-5K 2025.12		45
Qwen2.5-7B-Instruct 2025.12		43.9