Share your thoughts, 1 month free Claude Pro on usSee more

Paper-to-Code Reproduction on PaperBench Code (dev)

78.6Final Score

Paper2Code + auto-plan & code optimized

Updated 3mo ago

Evaluation Results

Method	Links
Paper2Code + auto-plan & code optimized 2025.12		78.6	68.2	15.25
RePro 2025.12		61.4	52.8	16.29
AUTOREPRODUCE (w/ Visual Diagram) 2025.05		49.6	-	-
AUTOREPRODUCE (Default Setting) 2025.05		48.5	-	-
PaperCoder 2025.05		45.1	-	-
AUTOREPRODUCE (w/o Paper Lineage) 2025.05		44.1	-	-
IterativeAgent 2025.05		43.4	-	-
IterativeAgent 2025.05		17.3	-	-
BasicAgent 2025.05		6.4	-	-