Share your thoughts, 1 month free Claude Pro on usSee more

User Study

Benchmarks

Task Name	Dataset Name	SOTA Result
Single-object 4D Motion Generation	User Study Single-object 4D Motion Generation 1.0 (test)	Prompt Alignment47	36
Image Editing	User Study 100 images (test)	User Selection Rate94.3	32
Image Style Transfer	User Study	Overall Quality Score83.9	30
Talking head synthesis	User Study	Lip Sync Quality4.46	18
Qualitative Interface Comparison	User Study (N=24) (between-subjects)	Mentions10	17
Image Personalization	User Study Personalization Tasks	Concept Preservation (CP)95.3	17
Video Generation	User Study	Interaction Plausibility Score6.55	16
Task-Oriented Robot-Human Handover	User Study Franka Panda	Failure Rate37	16
Text-to-Image Generation	User Study 12 Prompts (test)	Win Rate (Full Description)82.84	13
Single-character story generation	User Study	C-A Score4.62	13
Image Composition	User Study	Average Ranking1.52	13
3D Motion Generation	User Study	Overall Quality Preference89.67	13
Video Generation	User Study Generation-only (completed-session)	Pairwise Preference Rate100	12
Talking Face Emotion Editing	User Study Extended Emotion	Emotional Accuracy91	12
Talking Face Emotion Editing	User Study Basic Emotion	Emotional Expression84.5	12
Text-to-Image Generation	User Study Human Evaluation	VisualPrompter Preference60	12
Controllable Video Generation	User Study	Preference Rate92.2	12
Image Inpainting	User Study 40 random images (test)	UOM1.6	12
Text Alignment	User Study	Average Ranking1.54	12
3D Talking Head Generation	User Study	Lip Sync Accuracy (S)96	11
Talking Head Generation	User Study	Lip Sync156	11
Makeup Transfer	User Study	ID Score49.1	11
Image Editing	User Study	Semantic Faithfulness8.4	10
Semantic Transport	User Study	Prompt Alignment71	10
User Satisfaction Evaluation	User Study Industry	Average Score55.01	10

Showing 25 of 415 rows

...