Share your thoughts, 1 month free Claude Pro on usSee more
WorkDL logo mark

Multi-turn Instruction Following on MT Bench

9.16MT-Bench Score (GPT-4)

Llama-3.1-Nemotron-70B-Instruct

3.188324.738666.2897.83934Feb 26, 2025Apr 29, 2025Jul 1, 2025Sep 1, 2025Nov 3, 2025Jan 4, 2026Mar 8, 2026
Updated 9d ago

Evaluation Results

MethodLinks
2025.03
9.162,614.4----
2025.03
9.072,362.1----
2025.03
8.982,199.8----
8.811,619.9----
8.741,752.2----
8.491,664.7----
2025.03
8.291,827.6----
8.221,728.6----
2026.03
6.72-----
2026.03
6.39-----
2026.03
6.34-----
2026.03
6.31-----
2026.03
6.2-----
2026.03
6.2-----
2026.03
6.14-----
2026.03
6.1-----
2026.03
6.1-----
2026.03
5.95-----
2026.03
5.86-----
2026.03
5.8-----
2026.03
5.72-----
2026.03
5.7-----
2026.03
5.64-----
2026.03
5.62-----
2025.02
5.086-----
2025.02
4.963-----
2025.02
4.894-----
2025.02
4.869-----
2025.02
4.815-----
2025.02
4.776-----
2025.02
4.45-----
2025.02
4.44-----
2025.02
4.352-----
2025.02
4.314-----
2025.02
4.283-----
2025.02
4.12-----
2025.02
4.018-----
2025.02
3.968-----
2025.02
3.963-----
2025.02
3.912-----
2025.02
3.731-----
2025.02
3.718-----
2025.02
3.639-----
2025.02
3.418-----
2026.03
--4.536.5-8.47315
2026.03
--4.185.86-7.54316
2026.03
--4.095.43-6.77317
2026.03
--5.597.98-10.37309
2026.03
--4.415.78-7.15315
2026.03
--4.435.62-6.81309
2026.03
--4.465.41-6.36315
2026.03
--4.425.45-6.48313
2026.03
--4.465.29-6.12314
2026.03
--5.885.96-6.04300
2026.03
--5.815.65-5.49311
2026.03
--5.535.57-5.61260
2026.03
--5.425.16-4.9258
2026.03
--4.093.54-2.99244
2026.03
--3.843.1-2.36231
2026.03
--3.893.21-2.53243
2026.03
--4.644.22-3.8256
2026.03
--3.873.38-2.89247
2026.03
--3.933.22-2.51241
2026.03
--4.013.14-2.27243
2026.03
--3.942.99-2.04232
2026.03
--3.962.96-1.96243
2026.03
--8.615.76-2.91258
2026.03
--8.535.49-2.45278
2026.03
--8.735.94-3.15294
2026.03
--8.625.69-2.76288