Classification Datasets

Benchmarks

Task Name	Dataset Name	SOTA Result
Image Classification	11 Classification Datasets (ImageNet, SUN397, FGVC Aircraft, EuroSAT, Stanford Cars, Food-101, Oxford-IIIT Pets, Oxford Flowers 102, Caltech101, DTD, UCF101)	ImageNet Accuracy68.4	39
Concept Extraction Evaluation	4 classification datasets average	RAcc99.8	35
Tabular Classification	53 classification datasets (unseen)	Mean Accuracy75.42	18
Zero-shot Classification	Classification Datasets (MMLU, OBQA, ARC-e, WinoGrande, ARC-c, PIQA, HellaSwag)	MMLU (5-shot)37.1	18
Classification	80 classification datasets	Median Effect Size (F1 pts)0.11	17
Open-Vocabulary Classification	11 classification datasets (test)	ImageNet Accuracy76.77	16
Classification	medium-sized classification datasets	Accuracy78.58	14
Selective Prediction	Classification Datasets Average (test)	NAURC72.5	12
Classification	Classification Datasets	Accuracy100	10
Classification	25 Classification Datasets	Mean Accuracy89.1	10
Classification	7 classification datasets (Iris, Wine, Breast Cancer, Digits, etc.) (cross-validation)	Accuracy91.17	10
Tabular Classification	50 classification datasets	Mean Accuracy84.36	10
Classification	6 out-of-domain classification datasets (test)	Accuracy65.2	9
Tabular Data Generation	Classification Datasets	Avg. JSD0.05	2
Classification	15 Classification Datasets	TabMixNN Wins1,067	1

Showing 15 of 15 rows