Share your thoughts, 1 month free Claude Pro on usSee more

User feature quality evaluation on Honor dataset

2.51Rationality Score

Human

Updated 2mo ago

Evaluation Results

Method	Links
Human 2026.04		2.51	2.55
BUA 2026.04		2.46	2.39
No Tune 2026.04		1.9	1.83