Share your thoughts, 1 month free Claude Pro on usSee more

Research Soundness Evaluation on 34 report pairs (sample)

70.6Evidence Support

ScholarEval

Updated 4mo ago

Evaluation Results

Method	Links
ScholarEval 2025.10		70.6	79.4	82.4
OpenAI Deep Research 2025.10		14.7	11.8	11.8
Tie 2025.10		14.7	8.8	5.9