Share your thoughts, 1 month free Claude Pro on usSee more

Multi-evidence Aggregation on Multi-evidence Aggregation Dataset (test)

0.036ECE

Baseline (Uniform Avg)

Updated 4mo ago

Evaluation Results

Method	Links
Baseline (Uniform Avg) 2026.03		0.036	85	-	-	50	-
LPF-Learned 2026.03		0.058	95.4	0.0085	0.002	12	0.013
LPF-SPN 2026.03		0.186	92	-	0.002	12	0.013