Share your thoughts, 1 month free Claude Pro on usSee more

Text Generation on TruthfulQA

15.5BLEU-4

Factual SFT

Updated 4mo ago

Evaluation Results

Method	Links
Factual SFT 2026.01		15.5	38.3
SFT 2026.01		14.2	36.3
Factual SFT + Standard DPO 2026.01		12.4	34.4
Base Model 2026.01		10.6	31.5
Standard DPO 2026.01		10.5	31.8
Factual SFT + F-DPO 2026.01		10.2	31.8
F-DPO 2026.01		9.9	30.6