Share your thoughts, 1 month free Claude Pro on usSee more

Task Representation Accuracy on Task Vector Evaluation Suite Llama2-13B (test)

87.69Accuracy

LTV

Updated 3mo ago

Evaluation Results

Method	Links
LTV 2025.09		87.69
LTV 2025.09		84.99
LTV 2025.09		82.25
LTV 2025.09		80.33
FV 2025.09		77.51
LTV 2025.09		71.53
LTV 2025.09		51.46
Vanilla TV 2025.09		43.84
FV 2025.09		42.25
FV 2025.09		41.59
FV 2025.09		36.97
Vanilla TV 2025.09		27.67
FV 2025.09		24.74
Vanilla TV 2025.09		20.46
Vanilla TV 2025.09		16.42
Vanilla TV 2025.09		16.07
Vanilla TV 2025.09		1.84
FV 2025.09		1.22