Share your thoughts, 1 month free Claude Pro on usSee more

Multi-turn Conversation Evaluation on EduFeedback alternate

8.3MT-Bench Score

SFT

Updated 2mo ago

Evaluation Results

Method	Links
SFT 2026.05		8.3
DPO 2026.05		8.3
SFT 2026.05		8.1
COALA 2026.05		8.1
COALA 2026.05		8
SFT 2026.05		7.9
DPO 2026.05		7.9
ORPO 2026.05		7.9
ORPO 2026.05		7.8
COALA 2026.05		6.9
ORPO 2026.05		6.8
DPO 2026.05		6.1
SFT 2026.05		1.7
COALA 2026.05		1.7
SFT 2026.05		1.6
ORPO 2026.05		1.6
COALA 2026.05		1.6
DPO 2026.05		1.3
DPO 2026.05		1
ORPO 2026.05		1