RAVDESS

Benchmarks

Task Name	Dataset Name	SOTA Result
Audio-driven Talking Head Generation	RAVDESS (cross-identity)	FAD1.885	64
Talking Head Generation	RAVDESS intra-identity 1.0	FAD0.833	56
Talking Face Generation	RAVDESS	Realism70	48
Emotion Recognition	RAVDESS	Accuracy72	46
Speech Emotion Recognition	RAVDESS	Unweighted Accuracy92.58	43
Emotion Recognition	RAVDESS (test)	Accuracy0.9735	29
Audio Classification	RAVDESS	Base Accuracy72.85	27
Audio-Driven Facial Animation	RAVDESS 42 (test)	PSNR30.772	24
Emotion Recognition	RAVDESS (val)	Accuracy97.46	20
Emotion Recognition	RAVDESS 7-class	WAR83.61	19
Discrete Emotion Recognition	Ravdess 19 (test)	Accuracy44.04	19
Avatar Fingerprinting	RAVDESS (Evaluation)	AUC (%)83	12
Speech Emotion Recognition	RAVDESS 8 classes (test)	Weighted Accuracy84.72	12
Speech Emotion Recognition	RAVDESS In-Domain v1 (test)	Accuracy85.74	12
Audiovisual Emotion Recognition	RAVDESS	Accuracy (AV)81.58	12
Song Emotion Recognition	RAVDESS Song	Weighted Accuracy85.8	11
Response Appropriateness	RAVDESS	Response Appropriateness48	9
Emotion Recognition	RAVDESS (6-fold cross-val)	Accuracy74.86	9
Emotion classification	RAVDESS four-class subset n=672	Accuracy71	8
Visual-to-Audio Prediction	RAVDESS	Accuracy82.78	8
Audio-to-Visual Prediction	RAVDESS	Accuracy76.06	8
Talking-head generation	RAVDESS	IQA Score4.602	8
Speech Emotion Recognition	RAVDESS (6-fold subject-independent cross-validation)	Weighted Accuracy (WA)93.4	8
Emotion Recognition	RAVDESS (speaker-independent)	UAR82.29	8
Facial Emotion Recognition	RAVDESS	WAR87.99	8

Showing 25 of 38 rows