CB

Benchmarks

Task Name	Dataset Name	SOTA Result
Natural Language Inference	CB	Accuracy98.2	129
Classification	CB	Accuracy91.1	76
Natural Language Inference	CB SuperGLUE (test)	Accuracy91.43	33
Natural Language Inference	CB	Average Accuracy91	29
Natural Language Inference	CB	Loss0.03	20
Natural Language Inference	CB val (test)	Accuracy94.6	19
CommitmentBank	CB	Accuracy84.99	16
Natural language inference	CB (test)	Accuracy89.3	13
Natural Language Inference	CB Far OOD	Accuracy (CB Far OOD)94.6	10
Text Classification	CB (test)	Macro-F164.6	10
Natural Language Inference	CB	Total Communication Time (10^3 s)5.43	9
Thermal Image Restoration	CB EN	MUSIQ Score70.89	8
Price Negotiation	CB Human Interaction	Success Rate48.3	8
Price Negotiation	CB User Simulation	Success Rate (SR)57.5	8
Natural Language Inference	CB SuperGLUE (test dev)	Accuracy84	8
Natural Language Inference	CB	Accuracy87.5	8
Four-class classification	CB (evaluation set)	Precision59.08	8
Natural Language Inference	CB	F161.51	7
LLM fine-tuning	CB (test)	Number of Queries6,894	6
Classification	CB UCI Repository (test)	Accuracy74.8	6
Natural language inference	CB	Macro F1 Score0.537	6
Natural Language Inference	CB	Acc (0-shot)82.1	6
Natural Language Inference	CB (dev)	Accuracy0.84	6
Natural Language Inference	CB 32 samples	F1 Score86.5	6
Natural Language Inference	CB	Final Accuracy87.5	4

Showing 25 of 27 rows