Share your thoughts, 1 month free Claude Pro on usSee more

MMLongBench

Benchmarks

Task Name	Dataset Name	SOTA Result
Multimodal Document Question Answering	MMLongBench-Doc	Overall Accuracy65.8	77
Long-context document understanding	MMLongBench-Doc	Accuracy55.8	58
Document Visual Question Answering	MMLongbench doc	Accuracy45.6	48
Visual Document Retrieval	MMLongBench	Doc Retrieval Rate53.82	46
Document Question Answering	MMLongBench-Doc	Accuracy65.8	40
Multimodal Document Question Answering	MMLongBench	Accuracy48.2	26
Long-document Visual Question Answering	MMLongBench Overall	Average Score90.77	22
Long-document Visual Question Answering	MMLongBench 128K context	MMLB-D83.33	22
Long-document Visual Question Answering	MMLongBench 64K context	MMLB-D93.1	22
Retrieval	MMLongBench	Recall75.86	18
Long-context Multi-modal Understanding	MMLongBench	Text Accuracy27.49	17
Document Question Answering	MMLongBench-Doc (test)	Accuracy49.09	16
Document Understanding, OCR & Charts	MMLongBench Doc	Score57.5	14
Evidence-page retrieval	MMLongBench-Doc	Recall75.68	12
Reasoning over rich modalities	MMLongBench Doc	Accuracy42.3	12
Multimodal Document Question Answering	MMLongBench (test)	Chart Acc.34.7	12
Long-context Visual Question Answering	MMLongBench 32K	Accuracy82.4	11
Long-context Visual Question Answering	MMLongBench 128K	Accuracy78.6	11
Document Question Answering	MMLongBench	Exact Match43.8	11
Retrieval	MMLongBench Finreport	MRR@1049.62	6
Retrieval	MMLongBench Doc	MRR@1047.64	6
LongContext Understanding	MMLongBench-Doc	Pass@161.4	5
LongContext Understanding	MMLongBench	Pass@174.8	5
Dataset Description Extraction	MMLongBench-Doc	Accuracy94.9	5
Long-document Visual Question Answering	MMLongBench 512K context	MMLongBench-D Score31.91	4

Showing 25 of 39 rows