Share your thoughts, 1 month free Claude Pro on usSee more

Generation on MLLMU-Bench (Forget Set)

64.5Rouge Score

Vanilla

Updated 1mo ago

Evaluation Results

Method	Links
Vanilla 2025.02		64.5	6.78
Vanilla 2025.02		59.4	6.4
Vanilla 2025.02		57.5	6.34
Base 2026.05		57.1	-
Base 2026.05		56.7	-
GA 2026.05		56.7	-
GA 2026.05		56.5	-
NPO 2026.05		56.1	-
KL_Min 2026.05		55.7	-
NPO 2026.05		55.5	-
KL_Min 2026.05		55.2	-
RMU 2026.05		53.2	-
RMU 2026.05		52.6	-
GA 2026.05		51.8	-
Base 2026.05		51.7	-
PO 2026.05		51.5	-
MANU 2025.02		50.3	3.48
NPO 2026.05		50.3	-
GA_Diff 2026.05		50.2	-
PO 2026.05		50.2	-
MANU 2025.02		49.1	3.27
GA 2025.02		48.5	3.38
RMU 2026.05		48.4	-
MANU 2025.02		48.1	3.73
Noise-T 2026.05		47.9	-
KL_Min 2026.05		45.4	-
ICU-T 2026.05		44.7	-
ICU-T 2026.05		42.1	-
GA_Diff 2026.05		31.6	-
GA_Diff 2026.05		31.4	-
PO 2026.05		30.8	-
Noise-T 2026.05		27.4	-
VGID 2026.05		25.3	-
Noise-T 2026.05		25.2	-
ICU-T 2026.05		25.1	-
VGID 2026.05		22.1	-
VGID 2026.05		20	-