Share your thoughts, 1 month free Claude Pro on usSee more

Complex Reasoning on Frames

90.6Accuracy

Tongyi DeepResearch 30B

Updated 3mo ago

Evaluation Results

Method	Links
Tongyi DeepResearch 30B 2026.04		90.6
Claude-4.5-Sonnet 2026.04		85
DeepSeek-V3.1 2026.04		83.7
LiteResearcher-4B 2026.04		83.1
SFR-DeepResearch 2026.04		82.8
AgentCPM-Explore-4B 2026.04		82.7
Claude-4-Sonnet 2026.04		80.7
Mirothinker 8B 2026.04		80.6
DeepSeek-V3.2 2026.04		80.2
Kimi-Researcher 2026.04		78.8
WebExplorer-8B 2026.04		75.7
ASearcher QWQ v2 2026.04		74.5
Kimi-K2-0905 2026.04		58.1