Share your thoughts, 1 month free Claude Pro on usSee more

Instruction-guided image editing preference prediction on AURORA-Bench

63.62Accuracy

EDITREWARD

Updated 4mo ago

Evaluation Results

Method	Links
EDITREWARD 2025.09		63.62
EDITREWARD 2025.09		59.5
ADIEE 2025.09		55.56
GPT-4o 2025.09		50.81
Gemini-2.5-Flash 2025.09		47.63
GPT-5 2025.09		47.27
Gemini-2.0-Flash 2025.09		44.31
Qwen2.5-VL-7B-Inst 2025.09		38.62
Qwen2.5-VL-32B-Inst 2025.09		37.06
Random 2025.09		33.43
Qwen2.5-VL-3B-Inst 2025.09		30.69
MiMo-VL-7B-SFT-2508 2025.09		30.43