EditReward-Bench

Benchmarks

Task Name	Dataset Name	SOTA Result
Reward Modeling	EditReward-Bench	PF85.4	25
Multi-way preference ranking	EDITREWARD-BENCH	Preference Score (K=2)66.2	23
Image editing preference evaluation	EditReward-Bench	Accuracy63.27	14
Visual Consistency Assessment	EditReward-Bench 2025 (test)	Subject Addition Accuracy80.88	6

Showing 4 of 4 rows