Share your thoughts, 1 month free Claude Pro on usSee more

Agentic Task on ResearchQA

73.7Score

DR-Rubric-8B (GPT-5)

Updated 1mo ago

Evaluation Results

Method	Links
DR-Rubric-8B (GPT-5) 2026.05		73.7
DR-Rubric-8B (BS-3) 2026.05		72.4
DR-Rubric-8B (Gemini) 2026.05		71.7
Qwen3-8B-SFT 2026.05		69.9
DR-Tulu-RL-8B 2026.05		67.1
DR-Tulu-SFT-8B 2026.05		66.7
Qwen3-8B 2026.05		66.6
WebExplorer-8B 2026.05		66.1
Qwen2.5-7B 2026.05		65.5
Search-R1-7B 2026.05		63.1