Share your thoughts, 1 month free Claude Pro on usSee more

Knowledge Base Question Answering on GrailQA Freebase (test)

86.9Hits@1

SoG

Updated 1mo ago

Evaluation Results

Method	Links
SoG 2025.10		86.9
Plan-on-Graph 2025.10		84.7
ReKnoS 2025.10		82.7
Think-on-Graph 2025.10		81.4
Debate-on-Graph 2025.10		80
EffiQA 2025.10		78.4
PoG 2025.09		77.93
ReknoS 2025.09		75.67
PoG 2025.09		75.3
ReknoS 2025.09		73.67
iQUEST 2025.10		73.5
ToG 2025.09		71.53
PoG 2025.09		69.88
ReknoS 2025.09		69.58
KG-R1 2025.09		68.55
Think-on-Graph 2025.10		65.5
KG-R1 2025.09		64.84
GPT-4o-mini + KG 2026.03		60
DeepSeek-R1-Distill-Llama-70B + KG 2026.03		59.02
LLaMA-3.3-70B + KG 2026.03		57.7
ToG 2025.09		54.73
ToG 2025.09		53.2
KG-Hopper w/Qwen-2.5-7B 2026.03		50.1
LLaMA-3.1-8B (SFT) + KG 2026.03		47.7
Qwen-2.5-7B (SFT) + KG 2026.03		46.18
Qwen-2.5-7B + KG 2026.03		41.1
LLaMA-3.1-8B + KG 2026.03		40.4
Chain-of-Thought 2025.10		38
Self-Consistency 2025.10		37.4
GPT-4o-mini 2026.03		36.22
IO Prompt 2025.10		35.3
GPT-4o 2026.03		35.01
LLaMA-3.3-70B 2026.03		33.79
DeepSeek-R1-Distill-Llama-70B 2026.03		31.7
Qwen-2.5-7B 2026.03		29.53
LLaMA-3.1-8B 2026.03		28.35
RoG 2025.09		22.63
RoG 2025.09		18.1
RoG 2025.09		17.67
SC 2025.09		15.73
CoT 2025.09		14.6
IO 2025.09		12.8
IO 2025.09		11.63
SC 2025.09		11.43
CoT 2025.09		10.53
SC 2025.09		8.6
IO 2025.09		8.07
CoT 2025.09		7.73