Share your thoughts, 1 month free Claude Pro on usSee more

Summarization on SAMSum (ROUGE-L, GPT-4o-Judge)

31.46ROUGE-L

LongGuide

Updated 4mo ago

Evaluation Results

Method	Links
LongGuide 2025.06		31.46	7.72
LongGuide 2025.06		30.65	7.72
LongGuide 2025.06		30.47	7.59
LongGuide 2025.06		28.35	7.73
Mistral-it (0.2) 2025.06		27.13	7.66
APO 2025.06		26.23	7.44
APO 2025.06		25.05	7.45
APO 2025.06		24.22	7.28
ChatGPT 2025.06		23.83	7.43
APO 2025.06		23.77	7.31
ChatGPT 2025.06		22.21	7.32
Mistral-it (0.2) 2025.06		22.2	7.43