Share your thoughts, 1 month free Claude Pro on usSee more

General Performance Evaluation on O2M Benign Clinical Queries

30.56RR

H-R Demon

Updated 3mo ago

Evaluation Results

Method	Links
H-R Demon 2025.06		30.56
H-R Demon 2025.06		22.78
H-R Demon 2025.06		12.78
H-R Demon 2025.06		6.31
H-R Demon 2025.06		4.7
H-R Demon 2025.06		4.7
H-R Demon 2025.06		4.6
H-R Demon 2025.06		4.44
Baseline (No Demon) 2025.06		3.03
B-A Demon 2025.06		2.83
B-A Demon 2025.06		2.78
B-A Demon 2025.06		2.53
B-A Demon 2025.06		2.47
Baseline (No Demon) 2025.06		2.12
B-A Demon 2025.06		1.67
B-A Demon 2025.06		1.62
B-A Demon 2025.06		1.46
B-A Demon 2025.06		1.21