Our new X account is live! Follow @wizwand_team for updates

Factuality Evaluation on Long-form summarization factuality dataset (test)

66.2Balanced Accuracy

FENICE

Updated 4d ago

Evaluation Results

Method	Links
FENICE 2024.03		66.2
FENICE 2024.03		65.7
MENLI 2024.03		61.7
AlignScore 2024.03		61.3
DAE 2024.03		51.4