Share your thoughts, 1 month free Claude Pro on usSee more

Gap discovery quality on Scientist-Bench 27 tasks

5Gaps/Task

AI-Supervisor (RWM)

Updated 4mo ago

Evaluation Results

Method	Links
AI-Supervisor (RWM) 2026.03		5	80.7	100	4.44
LLM-only brainstorm 2026.03		4.9	67.9	92.6	4.15
Divergent-convergent 2026.03		2	75.5	92.6	4.04