Share your thoughts, 1 month free Claude Pro on usSee more

Instruction Following on Vicuna benchmark

8.09GPT-4 Evaluation Score

llama2 → CP → FT + chat vector

Updated 5mo ago

Evaluation Results

Method	Links
llama2 → CP → FT + chat vector 2023.10		8.09
llama2 → CP → FT + 0.5 chat vector 2023.10		8.02
llama2 → CP → FT + 0.5 chat vector 2023.10		7.89
llama2 → CP → FT + chat vector 2023.10		7.86
llama2 → CP → FT 2023.10		7.58
llama2 → CP → FT 2023.10		7.47
llama2 → CP → FT + chat vector 2023.10		7.37
llama2 → CP + chat vector 2023.10		7.07
llama2 → CP → FT + chat vector 2023.10		7.06
llama2 → CP + chat vector 2023.10		7.03
llama2 → CP + chat vector 2023.10		6.7
llama2-chat → CP → FT 2023.10		6.46
llama2 → CP → FT 2023.10		6.13
llama2 → CP + chat vector 2023.10		6.04
llama2-chat → CP → FT 2023.10		5.89
llama2 → CP → FT 2023.10		5.5
llama2 → CP + 0.5 chat vector 2023.10		5.06
llama2 → CP + 0.5 chat vector 2023.10		4.61