Conversation Evaluation on Proprietary Chinese 500 Multi-turn Dialogues (test)

79.4Win Rate vs GPT4

C-SFT-Empathy

Updated 2mo ago

Evaluation Results

Method	Links
C-SFT-Empathy 2024.09		79.4	97.5	77.3
Llama3-70B-Instruct 2024.09		10.2	-	9