STVQA

Benchmarks

Task Name	Dataset Name	SOTA Result
Scene Text-Centric Visual Question Answering	STVQA	Accuracy0.759	20
Spatial Visual Question Answering	STVQA 7K (val)	Accuracy93	19
Spatial Reasoning	STVQA 300 samples 7k (train)	Relative Score88.5	13
Spatial Reasoning	STVQA-7k (test)	Relative Position Accuracy79.3	6
Visual Question Answering	STVQA-7k	Relation Acc86.4	6

Showing 5 of 5 rows