Share your thoughts, 1 month free Claude Pro on us
See more
Home
/
Benchmarks
Short Text Generation on Stylized Feedback Generation Benchmark
Loading...
0.191
ROUGE-1 Score
PAT
0.11196
0.13248
0.153
0.17352
Apr 27, 2026
ROUGE-1 Score
ROUGE-L Score
MET Score
LLM Score
Updated 1mo ago
Evaluation Results
Method
Method
Links
ROUGE-1 Score
ROUGE-L Score
MET Score
LLM Score
PAT
LLM=Qwen3
2026.04
0.191
0.189
0.174
3.716
GraSPeR
LLM=Qwen3
2026.04
0.17
0.168
0.127
3.292
PAT
LLM=LlaMA3
2026.04
0.166
0.163
0.116
3.325
GraSPeR
LLM=LlaMA3
2026.04
0.157
0.155
0.127
3.175
PGraph
LLM=LlaMA3
2026.04
0.139
0.134
0.139
3.076
PGraph
LLM=Qwen3
2026.04
0.127
0.122
0.134
3.586
LaMP
LLM=LlaMA3
2026.04
0.121
0.116
0.136
2.888
LaMP
LLM=Qwen3
2026.04
0.115
0.11
0.135
3.356
Feedback
Search any
task
Search any
task