Conversational Ability

Benchmarks

Dataset Name	SOTA Method	Metric
MT-Bench	Qwen3-32B	MT-Bench Score7.58	28	4mo ago
Alpaca (test)	LoRA	Alpaca LC Win Rate71.87	20	5mo ago
Vicuna Eval (test)	FAA	Vicuna Eval GPT-4 Score8.91	20	5mo ago
CharacterEval	GPT-4+PCL*	Fluency3.612	13	5mo ago

Showing 4 of 4 rows