Share your thoughts, 1 month free Claude Pro on usSee more

Generative multiple-choice on TruthfulQA (single)

78.1Accuracy

TACS-S (Sentence-level)

Updated 5mo ago

Evaluation Results

Method	Links
TACS-S (Sentence-level) 2024.03		78.1
TACS-T (Token-level) 2024.03		77.1
TACS-T (Token-level) 2024.03		62.5
TACS-S (Sentence-level) 2024.03		60.6
Mistral-Instruct-v0.2 2024.03		54.7
Llama 2-Chat 2024.03		49.1