Share your thoughts, 1 month free Claude Pro on usSee more

Reasoning and Knowledge Assessment on ARC bo

53.67Accuracy

Ours-MoE-SFT

Updated 2mo ago

Evaluation Results

Method	Links
Ours-MoE-SFT 2025.07		53.67
Ours-SFT 2025.07		48.39
Ours-MoE-Base-8k 2025.07		45.79
Ours-MoE-Base 2025.07		44.96
Ours-Base-32k 2025.07		44.62
Ours-Base 2025.07		44.32
DeepSeek-R1-Distill-Llama-8B 2025.07		30.38
Qwen2.5-7B-base 2025.07		29.6
LLaMA3.1-8B-Instruct 2025.07		29.31
Qwen3-8B 2025.07		29.16
Qwen2.5-7B-Instruct 2025.07		28.47