HuggingGPT

Benchmarks

Task Name	Dataset Name	SOTA Result	Trend
Response Generation	HuggingGPT Human Evaluation Set 130 diverse requests (test)	Success Rate63.08		3
Task Planning	HuggingGPT Task Planning (Single Task)	Accuracy52.62		3

Showing 2 of 2 rows