Share your thoughts, 1 month free Claude Pro on usSee more

ListOps

Benchmarks

Task Name	Dataset Name	SOTA Result
Sequence Classification	ListOps	Accuracy (%)98.85	35
Logical Reasoning	ListOps	Accuracy78	32
Hierarchical Reasoning	ListOps Long Range Arena (test)	Accuracy63.04	26
Hierarchical reasoning on symbolic sequences	Long ListOps (test)	Accuracy62.75	22
Hierarchical Classification	ListOps	Accuracy61.3	12
Logical Expression Evaluation	ListOps-O Argument Generalization (Arguments 15)	Accuracy79	11
Logical Expression Evaluation	ListOps-O Argument Generalization (Arguments 10)	Accuracy0.8415	11
Logical Expression Evaluation	ListOps-O Length Generalization (Lengths 900-1000)	Accuracy99.5	11
Logical Expression Evaluation	ListOps-O Length Generalization (Lengths 500-600)	Accuracy99.4	11
Logical Expression Evaluation	ListOps-O Length Generalization (Lengths 200-300)	Accuracy99.9	11
Logical Expression Evaluation	ListOps-O near-IID (Lengths < 1000, Arguments < 5)	Accuracy99.9	11
List operations evaluation	ListOps (5, 14) (test)	Mean Accuracy53.1	7
List operations evaluation	ListOps (5, 9) (test)	Mean Accuracy49.6	7
List operations evaluation	ListOps (3, 14) (test)	Mean Accuracy79.1	7
List operations evaluation	ListOps (3, 9) (test)	Mean Accuracy89.9	7
Mathematical Expression Evaluation	ListOps Long Range Arena (test)	Accuracy41.4	7
Logical operations parsing	ListOps mid L1024	Accuracy85.4	6
Long-range sequence modeling	ListOps Long Range Arena (LRA) 2K (test)	Accuracy37.9	6
Long-range sequence modeling	ListOpsMix (test)	Accuracy70.43	5
Unsupervised Parsing	ListOps (test)	Accuracy68.07	5
Unsupervised Parsing	ListOps (val)	Accuracy67.65	5
Unsupervised Parsing	ListOps simplified (test)	Accuracy (Max)93.78	4

Showing 22 of 22 rows