Share your thoughts, 1 month free Claude Pro on usSee more

Multi-Doc Question Answering on LongBench-E

49.6F1 Score

Teacher Model (w/ Context)

Updated 2mo ago

Evaluation Results

Method	Links
Teacher Model (w/ Context) 2025.10		49.6
Mean-Pooling 2025.10		45.9
Compression-Tokens (Bidirectional) 2025.10		43
Mean-Pooling 2025.10		41.4
Compression-Tokens (Causal) 2025.10		40.9
Compression-Tokens (Bidirectional) 2025.10		38.2
Mean-Pooling 2025.10		36
Compression-Tokens (Causal) 2025.10		32.5
Compression-Tokens (Bidirectional) 2025.10		32.1
Compression-Tokens (Causal) 2025.10		31.6
LLMLingua2 2025.10		29.4
PCC Large 2025.10		28
LLMLingua2 2025.10		22.4
LLMLingua2 2025.10		21.8
Teacher Model (w/o Context) 2025.10		21.7
PCC Large 2025.10		11.4
PCC Large 2025.10		7.2