Share your thoughts, 1 month free Claude Pro on usSee more

Narrative Reasoning on WebQA (test)

0.623BLEURT

LogicAgent

Updated 5mo ago

Evaluation Results

Method	Links
LogicAgent 2026.02		0.623
CEN 2026.02		0.613
NSVS-TL 2026.02		0.612
NS-DR 2026.02		0.608
Qwen3-VL-8B 2026.02		0.605
GIT 2026.02		0.605
GPT-4o 2026.02		0.603
Gemini 1.5 Pro 2026.02		0.599
Qwen2.5-VL-7B 2026.02		0.594
Vid2Seq 2026.02		0.587
ShareGPT4Video 2026.02		0.585
SEM-POS 2026.02		0.58
AKGNN 2026.02		0.58
VideoLLaVA 2026.02		0.563