Fairness Evaluation on UnQover

99.6Score

Self-Debias Offline + Self-Correction

Updated 18d ago

Evaluation Results

Method	Links
Self-Debias Offline + Self-Correction 2026.04		99.6
Self-Debias Iter1 2026.04		99.6
Self-Debias SFT 2026.04		99.5
Self-Debias SFT + Self-Correction 2026.04		99.5
Self-Debias Offline 2026.04		99.5
Self-Debias Iter1 + Self-Correction 2026.04		99.5
Self-Debias Iter2 2026.04		99.5
Self-Debias Iter2 + Self-Correction 2026.04		99.5
Qwen1.5-8B 2026.04		97.3
Qwen2.5-7B-Instruct + Self-Correction 2026.04		97
Qwen1.5-8B + Self-Correction 2026.04		95.4
Qwen2.5-7B-Instruct 2026.04		93.9
DeepSeek-R1-Distill-Qwen-7B 2026.04		83.9
DeepSeek-R1-Distill-Qwen-7B + Self-Correction 2026.04		82.2
FairGPTQ-INT4 2025.09		77.76
FairGPTQ-INT4 2025.09		73.55
Base-FP16 2025.09		73.14
GPTQ-INT4 2025.09		71.71
GPTQ-INT4 2025.09		70.06
Base-FP16 2025.09		66.7
FairGPTQ-INT4 2025.09		58.89
Llama-3.1-8B-Instruct + Self-Correction 2026.04		57.8
FairGPTQ-INT4 2025.09		36.27
Base-FP16 2025.09		35.58
Base-FP16 2025.09		34.63
Llama-3.1-8B-Instruct 2026.04		33.5
GPTQ-INT4 2025.09		33.3
GPTQ-INT4 2025.09		32.1
Base-FP16 2025.09		30.06
GPTQ-INT4 2025.09		27.61
FairGPTQ-INT4 2025.09		26.7
FairGPTQ-INT4 2025.09		26.66
Base-FP16 2025.09		24.85
GPTQ-INT4 2025.09		14.03