Share your thoughts, 1 month free Claude Pro on usSee more

Tool-calling on ACEBench Extended Setting

65.17Overall Score

GT_Funs

Updated 4mo ago

Evaluation Results

Method	Links
GT_Funs 2026.03		65.17
ToolGT (Prompting) 2026.03		62.42
Tool-DC (TF) 2026.03		58.83
All_Funs 2026.03		58.58
HiTEC-ICL 2026.03		54.67
GT_Funs 2026.03		54.42
Tool-DC (TF) 2026.03		48.17
GT_Funs 2026.03		47.92
ToolGT (Prompting) 2026.03		46.58
Top-K 2026.03		46.31
Tool-DC (TF) 2026.03		46.08
Top-K 2026.03		38.58
Top-K 2026.03		38.02
All_Funs 2026.03		36.5
ToolGT (Prompting) 2026.03		35.33
HiTEC-ICL 2026.03		34.92
HiTEC-ICL 2026.03		25.42
All_Funs 2026.03		22