Share your thoughts, 1 month free Claude Pro on usSee more

Conversational response generation on FaithDial

19.2F1 Score

ChatR1-3b

Updated 2mo ago

Evaluation Results

Method	Links
ChatR1-3b 2025.10		19.2	84
SFT 2025.10		18.6	83.8
ChatR1-7b 2025.10		18.1	84.8
ChatR1 (w/o Rint.) 2025.10		15.5	81.3
CoT R1 2025.10		14.5	80.9
QR Search R1 2025.10		14.4	82.2
ChatGPT (DI) 2025.10		12.9	80.9
Qwen-Instr. (RAG) 2025.10		12.3	73.8
UniConv 2025.10		11.6	-
Qwen-Instr. (DI) 2025.10		10.9	64.8
Qwen-Instr. (CoT) 2025.10		9.6	64.8
IRCoT 2025.10		9.6	64.7