snarks on BBH (test)

79.43Accuracy

EvoPrompt(GA)

Updated 5mo ago

Evaluation Results

Method	Links
EvoPrompt(GA) 2025.03		79.43
EvoPrompt(GA)-OPTS(TS) 2025.03		78.65