Share your thoughts, 1 month free Claude Pro on usSee more

Answer Generation on CORAL

28.9F1

Ours

Updated 5mo ago

Evaluation Results

Method	Links
Ours 2026.01		28.9	46.8
Claude 2026.01		27.4	-
ChatGPT 2026.01		26.8	-
EvoRAG 2026.01		25.1	-
UniConv 2026.01		24.3	-
AgenticLM 2026.01		24.1	44.7
Ours 2026.01		22.4	43.2
AgenticLM 2026.01		22.1	42.6
ChatQA 2026.01		20.3	-
SFT 2026.01		18.8	43
SFT 2026.01		15.2	42.3
Search-R1 2026.01		3.9	41.2
Search-R1 2026.01		3.8	43