Share your thoughts, 1 month free Claude Pro on usSee more

Multi-agent Reasoning on ARMMAN

85.78Accuracy

OW-L

Updated 2mo ago

Evaluation Results

Method	Links
OW-L 2025.10		85.78
OW-I 2025.10		85.78
ISP 2025.10		85.78
Single Best 2025.10		85.32
MV 2025.10		85.24
OW-L 2025.10		85.1
OW-I 2025.10		84.94
ISP 2025.10		84.79
MV 2025.10		84.4