RESEARCHRUBRICS

Benchmarks

Task Name	Dataset Name	SOTA Result
Research Evaluation	ResearchRubrics	Accuracy49.74	19
ResearchRubrics	ResearchRubrics	Accuracy50.97	19
Long-horizon agentic task	ResearchRubrics	Performance49.36	18
Long-form research	ResearchRubrics	Score61.5	16
Deep Research	ResearchRubrics	Score50.8	8
Research Automation	RESEARCHRUBRICS	Score63.69	5
Deep Research Evaluation	ResearchRubrics	WQ Score66.6	3

Showing 7 of 7 rows