Share your thoughts, 1 month free Claude Pro on usSee more
WorkDL logo mark

Best feasible prompt identification on CNN/DailyMail (test)

0.172Average Soft Constrained Reward

MLP-CSR

-0.006880.039560.0860.13244May 14, 2026
Updated 19d ago

Evaluation Results

MethodLinks
2026.05
0.172
2026.05
0.167
2026.05
0.166
2026.05
0.165
2026.05
0.164
2026.05
0.164
2026.05
0.163
2026.05
0.162
2026.05
0.161
2026.05
0.161
2026.05
0.16
2026.05
0.16
2026.05
0.16
2026.05
0.16
2026.05
0.157
2026.05
0.157
2026.05
0.155
2026.05
0.155
2026.05
0.154
2026.05
0.154
2026.05
0.154
2026.05
0.154
2026.05
0.154
2026.05
0.153
2026.05
0.153
2026.05
0.151
2026.05
0.148
2026.05
0.146
2026.05
0.144
2026.05
0.142
2026.05
0.142
2026.05
0.138
2026.05
0.138
2026.05
0.136
2026.05
0.134
2026.05
0.134
2026.05
0.126
2026.05
0.123
2026.05
0.091
2026.05
0.088
2026.05
0.081
2026.05
0.072
2026.05
0.062
2026.05
0.045
2026.05
0.045
2026.05
0.044
2026.05
0.032
2026.05
0.032
2026.05
0.032
2026.05
0.032
2026.05
0.021
2026.05
0.021
2026.05
0.021
2026.05
0.02
2026.05
0.02
2026.05
0.019
2026.05
0.018
2026.05
0.018
2026.05
0.016
2026.05
0.015
2026.05
0.015
2026.05
0.015
2026.05
0.015
2026.05
0.01
2026.05
0.008
2026.05
0.008
2026.05
0.007
2026.05
0
2026.05
0
2026.05
0
2026.05
0
2026.05
0