Share your thoughts, 1 month free Claude Pro on usSee more

Instruction Following on IFBench (test)

55.95Score

GEPA+Merge

Updated 25d ago

Evaluation Results

Method	Links
GEPA+Merge 2026.04		55.95	-	-	-
GEPA 2026.04		52.72	-	-	-
FLOWBOT 2026.04		52.51	-	-	-
MetaHarness 2026.05		52.3	-	-	-
CRO 2026.05		51.3	-	-	-
Trace 2026.04		51.19	-	-	-
GEPA 2026.05		50.1	-	-	-
MIPROv2 2026.04		49.15	-	-	-
TextGrad 2026.04		48.64	-	-	-
Baseline 2026.04		47.79	-	-	-
Baseline 2026.05		42.4	-	-	-
TextGrad-M 2025.05		40.91	-	-	0.39
TextGrad-M 2025.05		40.82	-	-	0.28
AdalFlow-M 2025.05		39.33	-	-	0.012
GEPA 2025.07		38.61	-	-	-
TextGrad-M 2025.05		38.35	74.59	2.2	-
TextGrad 2025.05		38.12	-	-	0.17
COPRO-M 2025.05		38.12	-	-	0.56
TextGrad-M 2025.05		38.02	74.12	1.73	-
AdalFlow 2025.05		38	-	-	0.01
COPRO-M 2025.05		37.92	-	-	0.45
TextGrad 2025.05		37.56	-	-	0.04
COPRO-M 2025.05		37.52	68.9	1.05	-
TextGrad 2025.05		37.5	72.39	-	-
TextGrad 2025.05		37.2	72.96	-	-
Baseline 2025.07		36.9	-	-	-
COPRO 2025.05		36.89	-	-	0.56
AdalFlow-M 2025.05		36.67	72.63	0.8	-
COPRO-M 2025.05		36.25	68.79	0.94	-
MIPROv2 2025.07		36.22	-	-	-
GEPA 2025.05		36	72.11	-	-
GRPO 2025.07		35.88	-	-	-
GEPA 2025.05		35.67	-	-	0.012
AdalFlow 2025.05		35.33	71.83	-	-
COPRO 2025.05		34.12	67.84	-	-
GEPA+Merge 2025.07		28.23	-	-	-