Share your thoughts, 1 month free Claude Pro on usSee more

LLM Filtering on Manually adjudicated gold-standard CUIs Poor Mobility v1 (test)

205CUIs Count

GPT-5-mini

Updated 5mo ago

Evaluation Results

Method	Links
GPT-5-mini 2026.02		205	86	87	86
GPT-5 2026.02		171	76	93	83
manual 2026.02		92	23	52	32