Share your thoughts, 1 month free Claude Pro on usSee more

Long-form research on ResearchRubrics

61.5Score

Gemini Deep Research

Updated 2mo ago

Evaluation Results

Method	Links
Gemini Deep Research 2026.05		61.5
GPT-5 + Search 2026.05		60.5
OpenAI Deep Research 2026.05		59.7
RubricEM-8B (RL, 1400 steps) 2026.05		50.3
Tongyi DeepResearch-30B-A3B 2026.05		49.5
Gemini 3.1 Pro + Search 2026.05		49.1
Perplexity Deep Research 2026.05		48.7
DR Tulu-8B (RL, 1900 steps) 2026.05		46.4
RubricEM-8B (SFT) 2026.05		42.8
WebThinker QwQ-32B 2026.05		42.2
WebThinker-32B-DPO 2026.05		41.9
DR Tulu-8B (SFT) 2026.05		38.4
Ai2 ScholarQA – Claude Sonnet 2026.05		38.1
WebExplorer-8B 2026.05		33.4
Qwen3-8B + Our Search 2026.05		24.5
Search-R1-7B 2026.05		0