Share your thoughts, 1 month free Claude Pro on usSee more

Long-form generation on DiffTask

0.16PRR

HUQ-SATRMD

Updated 3mo ago

Evaluation Results

Method	Links
HUQ-SATRMD 2026.04		0.16
SATMD-MSP 2026.04		0.15
SAPLMA (mid) 2026.04		0.1
SATRMD-MSP 2026.04		0.09
HUQ-SATMD 2026.04		0.04
HUQ-SATMD 2026.04		0.02
SAPLMA (mid) 2026.04		0.02
HBO 2026.04		0.01
MSP 2026.04		-0.01
SATRMD-MSP 2026.04		-0.06
HBO 2026.04		-0.07
MSP 2026.04		-0.1
HUQ-SATRMD 2026.04		-0.11
SATMD-MSP 2026.04		-0.18