Share your thoughts, 1 month free Claude Pro on usSee more

LLM Filtering on Manually adjudicated gold-standard CUIs Fluid Overload v1 (test)

77CUIs Count

GPT-5-mini

Updated 4mo ago

Evaluation Results

Method	Links
GPT-5-mini 2026.02		77	50	92	65
GPT-5 2026.02		50	34	96	50
manual 2026.02		30	18	87	30