Share your thoughts, 1 month free Claude Pro on usSee more
WorkDL logo mark

Preference Alignment on HH-RLHF

99.4ASR

No Def.

-0.33625.55751.4577.343Apr 27, 2026
Updated 1mo ago

Evaluation Results

MethodLinks
2026.04
99.4--------88.2
2026.04
98.1--------88.4
2026.04
96.5--------88.8
2026.04
95.1--------87.9
2026.04
19.5--------83.5
2026.04
18.8--------82
2026.04
18.2--------84.1
2026.04
17.4--------86.8
2026.04
16.5--------82.4
2026.04
15.1--------85.8
2026.04
14.9--------87.1
2026.04
14.8--------85.8
2026.04
14.5--------83.8
2026.04
14.2--------83.2
2026.04
14.1--------85.2
2026.04
13.4--------85.5
2026.04
13.2--------86.2
2026.04
12.2--------82.1
2026.04
11.9--------86
2026.04
8.7--------87.6
2026.04
7.8--------87.3
2026.04
6.7--------86.5
2026.04
6.2--------86
2026.04
5.8--------85.5
2026.04
5.5--------85.7
2026.04
5.5--------86.9
2026.04
5.2--------85.1
2026.04
4.9--------86.1
2026.04
4.8--------86.1
2026.04
4.6--------85.8
2026.04
4.2--------85.9
2026.04
3.5--------86.5
2026.03
-71.9--------
2026.03
-69.9--------
2026.03
-72.7--------
2026.03
-75.2--------
2026.03
--43.9-------
2026.03
--44.6-------
2026.03
--51.9-------
2026.03
--43.7-------
2026.03
--33.5-------
2026.03
--45.8-------
2026.03
--46.4-------
2026.03
--42.1-------
2026.03
--55.1-------
2026.03
--75.9-------
2026.03
--80.7-------
2026.03
--79.7-------
2026.03
--86.7-------
2026.03
--86.6-------
2026.03
--89.5-------
2026.03
--85-------
2026.03
--85.8-------
2026.03
--89.4-------
2025.05
--66.67-------
2025.05
--75-------
2025.05
--80-------
2025.05
--83.33-------
2025.02
---0.2190.435-5.122-5.638---
2025.02
---0.2190.437-5.053-5.736---
2025.02
---0.2190.438-4.816-5.499---
2025.02
---0.2220.436-5.183-6.166---
2025.02
---0.2030.442-4.825-5.508---
2025.02
---0.1970.444-4.583-5.266---
2025.02
---0.1890.439-60.129-60.809---
2025.02
---0.1890.446-21.821-22.504---
2025.02
---0.1870.449-20.938-21.255---
2025.02
---0.2220.441-59.29-59.605---
2025.02
---0.1810.449-11.848-13.03---
2025.02
---0.2750.435-4.184-6.117---
2025.02
---0.2140.433-61.084-61.762---
2025.02
---0.2260.435-4.673-5.557---
2025.02
---0.2240.436-5.378-5.562---
2025.02
---0.220.425-----
2025.02
---0.230.43-0.795-1.448---
2025.02
---0.230.4310.349-0.455---
2025.02
---0.2320.432.7232.04---
2025.02
---0.2320.432-0.724-1.406---
2025.02
---0.2310.430.8160.215---
2025.02
---0.2320.4321.0790.41---
2025.02
---0.2230.429-5.199-5.264---
2025.02
---0.2320.428-0.382-1.254---
2025.02
---0.2310.424-0.321-0.926---
2025.02
---0.2250.43-7.63-7.674---
2025.02
---0.2310.432-0.978-1.411---
2025.02
---0.2310.432-0.969-1.302---
2025.02
---0.2210.431-5.76-5.819---
2025.02
---0.2290.432-1.702-3.121---
2025.02
---0.2310.432-0.822-1.268---
2025.02
--63.875----13.22522.9-
2025.02
--58.712----13.627.687-
2025.02
--57.612----13.87528.513-