Share your thoughts, 1 month free Claude Pro on usSee more

Agent Performance on AgentInstruct HELD-IN

2.75HELD-IN

GPT-4

Updated 5mo ago

Evaluation Results

Method	Links
GPT-4 2024.03		2.75
Agent-FLAN 2024.03		2.01
AgentLM-7B 2024.03		1.96
AgentTuning 2024.03		1.89
GPT-3.5 2024.03		1.59
Llama2-7B 2024.03		0.19