Share your thoughts, 1 month free Claude Pro on usSee more

String-level response similarity on RA-QA Global, Discriminative tasks

0.9BERTScore

RAMoEA-QA

Updated 1mo ago

Evaluation Results

Method	Links
RAMoEA-QA 2026.03		0.9	88.38
CareAQA-operaGT 2026.03		0.89	87.05
CareAQA-operaCT 2026.03		0.87	84.89
CareAQA-operaGT 2026.03		0.87	83.22
CareAQA-operaCT 2026.03		0.86	83.15
RAMoEA-QA 2026.03		0.83	81.02
PENGI 2026.03		-0.01	2.61
PENGI 2026.03		-0.09	0