Share your thoughts, 1 month free Claude Pro on usSee more

Clinical Reasoning on MEDREASON

73.4Pass@1

Outcome Reward

Updated 3mo ago

Evaluation Results

Method	Links
Outcome Reward 2025.10		73.4
Ours (Sparse) 2025.10		73.1
Ours (Interval) 2025.10		71.4
Ours (Dense) 2025.10		69.8
Ours (Sparse) 2025.10		66.1
Outcome Reward 2025.10		65
Ours (Interval) 2025.10		63.8
SFT 2025.10		63.5
Ours (Dense) 2025.10		58.3
SFT 2025.10		57.6
Outcome Reward 2025.10		56.3
Ours (Dense) 2025.10		53.7
SFT 2025.10		53
Ours (Interval) 2025.10		52.1
Ours (Sparse) 2025.10		25.2