Share your thoughts, 1 month free Claude Pro on usSee more

Long-form text generation on LongBench Write-en 1.0 (test)

91.8Sq

GPT-4o

Updated 4mo ago

Evaluation Results

Method	Links
GPT-4o 2025.02		91.8
GPT-4o mini 2025.02		90.3
LongWriter-Qwen + LongDPO 2025.02		88.6
Mistral-Large-Instruct 2025.02		88.3
LongWriter-Llama + LongDPO 2025.02		88.2
Claude 3.5 Sonnet 2025.02		87.7
GPT-4 Turbo 2025.02		86.6
GLM-4-9B-chat 2025.02		85.5
LongWriter-Llama 2025.02		82.2
Llama-3.1-70B-Instruct 2025.02		80.3
Llama-3.1-8B-Instruct 2025.02		70.6
Suri-I-ORPO 2025.02		53.5