Share your thoughts, 1 month free Claude Pro on usSee more

Reasoning on Xcope bo (acc)

65.4Accuracy

Ours-MoE-SFT

Updated 2mo ago

Evaluation Results

Method	Links
Ours-MoE-SFT 2025.07		65.4
Ours-Base 2025.07		59.8
Ours-Base 2025.07		59.8
Ours-Base-32k 2025.07		58.6
Ours-Base-32k 2025.07		58.6
Ours-SFT 2025.07		57.8
Ours-SFT 2025.07		57.8
Ours-MoE-Base 2025.07		57.8
Ours-MoE-Base-8k 2025.07		57.2
Yak-Llama2-7B 2025.07		53
Qwen2.5-7B-base 2025.07		51.8
LLaMA3.1-8B-Instruct 2025.07		51.6
Qwen2.5-7B-Instruct 2025.07		51.6
Tibetan-Alpaca-7B 2025.07		51.2
Tibetan-Llama2-7B 2025.07		50.6
Qwen3-8B 2025.07		50.4
DeepSeek-R1-Distill-Llama-8B 2025.07		50.4