Share your thoughts, 1 month free Claude Pro on usSee more

Utility assessment on MMLU-Pro

16.5Personalization Bias (PB)

Identity-Robust Generation

Updated 5mo ago

Evaluation Results

Method	Links
Identity-Robust Generation 2026.01		16.5
Identity-Robust Generation 2026.01		19.6
Identity-Robust Generation 2026.01		25.2
Vanilla Generation 2026.01		35
Prompt Steering 2026.01		36.6
Prompt Steering 2026.01		49
Vanilla Generation 2026.01		52.3
Prompt Steering 2026.01		60.8
Vanilla Generation 2026.01		448.3