Share your thoughts, 1 month free Claude Pro on usSee more

Document-level Information Extraction on MUC

46.48F1 Score

THINKTWICE Qwen 3 (oracle)

Updated 4mo ago

Evaluation Results

Method	Links
THINKTWICE Qwen 3 (oracle) 2026.01		46.48
THINKTWICE Llama R1 (oracle) 2026.01		42.32
THINKTWICE Qwen 3 2026.01		26.18
THINKTWICE Qwen 3 2026.01		24.82
Greedy Qwen 3 2026.01		22.99
ChatGPT 3.5 2026.01		22.41
THINKTWICE Llama R1 2026.01		21.96
THINKTWICE Llama R1 2026.01		21.23
Greedy Llama R1 2026.01		18.68