Share your thoughts, 1 month free Claude Pro on usSee more

General Evaluation on AGIEval

70.22Accuracy

DeepSeek-R1 (BF16)

Updated 4mo ago

Evaluation Results

Method	Links
DeepSeek-R1 (BF16) 2025.12		70.22
SQ-format 2025.12		69.58
FineRMoE 2026.03		56.7
PT 2026.03		56.2
C32A2 2026.03		55.91
CT 2026.03		52.67
NVShard 2026.03		49.36
HSA-UL 2025.11		44.08
C32A2 2026.03		43.26
FineRMoE 2026.03		43.14
PT 2026.03		39.83
CT 2026.03		38.91
TRM-MoE 2025.11		38.64
NVShard 2026.03		36.78
HSA-UL 2025.11		36.52
Qwen3 2025.11		33.58
Qwen2.5 2025.11		30.01
HSA-UL 2025.11		29.29
S16A4 2026.03		28.94
C32A2 2026.03		28.31
FineRMoE 2026.03		28.19
PT 2026.03		28.07
CT 2026.03		27.31
NVShard 2026.03		26.79
S16A4 2026.03		25.91
DU 2026.03		25.86
DU 2026.03		25.65
DU 2026.03		25.52
S16A4 2026.03		25.47