CommonsenseQA

Benchmarks

Task Name	Dataset Name	SOTA Result
Selective Prediction	CommonsenseQA	Power0.9999	207
Question Answering	CommonsenseQA	Accuracy89.3	172
Commonsense Reasoning	CommonSenseQA	Accuracy91.2	136
Question Answering	CommonsenseQA (CSQA)	Accuracy91.2	124
Commonsense Reasoning	CommonsenseQA	Accuracy (pass@1)86.6	108
Commonsense Question Answering	CommonSenseQA	Accuracy88.9	92
Commonsense Reasoning	CommonsenseQA (CSQA)	Accuracy85.7	62
Hallucination Detection	CommonsenseQA	Mean AUROC0.7563	62
Commonsense Reasoning	CommonsenseQA (test)	Accuracy90	62
Question Answering	CommonsenseQA (test)	Accuracy83.3	60
Question Answering	CommonsenseQA IH (test)	Accuracy88.9	57
Commonsense Reasoning	CommonSenseQA	BS0.1054	54
Question Answering	CommonsenseQA IH (dev)	Accuracy82.7	53
Commonsense Reasoning	CommonsenseQA (val)	Accuracy82.06	52
Question Answering	CommonsenseQA	AUC74.48	51
Commonsense Reasoning	CommonsenseQA (CSQA) v1.0 (test)	Accuracy64.11	46
Commonsense Reasoning	CommonsenseQA Non-Math	Accuracy87.31	32
Retrieval	CommonsenseQA	Accuracy86.81	25
Commonsense Question Answering	CommonsenseQA (CSQA) (val)	Accuracy75.7	23
Commonsense Question Answering	CommonsenseQA v1.0 (dev)	Accuracy79.3	22
Question Answering	CommonsenseQA (CSQA) (test)	VWR40.85	21
Multiple-choice Question Answering	CommonsenseQA (CSQA)	Accuracy66.4	21
Veracity Inference	COMMONSENSEQA 1,000 examples	Mean Hamming Similarity0.935	20
Knowledge	CommonSenseQA CoQA	Score66.91	20
Commonsense Question Answering	CommonsenseQA blind v1.0 (test)	Accuracy75.3	20

Showing 25 of 63 rows