Share your thoughts, 1 month free Claude Pro on usSee more

Code Generation on LiveCodeBench v6 (Pass@1)

56.3Pass@1

MiMo-RL 7B-R-TAP

Updated 1mo ago

Evaluation Results

Method	Links
MiMo-RL 7B-R-TAP 2026.03		56.3
MiMo 7B-RL 2026.03		49.3
OpenAI o1-mini 2026.03		46.8
QwQ-32B Preview 2026.03		39.1
PriFT-mass 2026.06		37.25
Claude 3.5 Sonnet-1022 2026.03		37.2
PriFT-prob 2026.06		36.87
R1-Distill-Qwen-14B 2026.03		31.9
GPT-4o 0513 2026.03		30.9
Original 2026.06		28.34
ASFT 2026.06		26.73
IDFT 2026.06		24.74
R1-Distill-Qwen-7B 2026.03		23.9
TALR 2026.06		23.6
DFT 2026.06		23.22
EAFT 2026.06		23.13
SFT 2026.06		21.52