Share your thoughts, 1 month free Claude Pro on usSee more

Kernel Generation on KernelBench Level 1

34Correctness Rate (Round 1)

Codex

Updated 4mo ago

Evaluation Results

Method	Links
Codex 2026.03		34	82	16	70
EvoKernel 2026.03		25	33	6	11
Pass@k 2026.03		24	36	9	19
Pass@k 2026.03		22	30	7	8
Pass@k 2026.03		21	33	7	9
EvoKernel 2026.03		20	97	7	90
Refinement 2026.03		19	88	7	41
Refinement 2026.03		16	44	0	12
Refinement 2026.03		13	22	2	6
EvoKernel 2026.03		9	39	2	19