Share your thoughts, 1 month free Claude Pro on usSee more

Binary Inconsistency Detection on LLM

70.27Accuracy

ChatGPT-SpanMoE

Updated 5mo ago

Evaluation Results

Method	Links
ChatGPT-SpanMoE 2024.06		70.27
ChatGPT-SpanMoE 2024.06		67.96
ChatGPT-Span 2024.06		64.84
ChatGPT-Span 2024.06		63.89
ChatGPT-DA 2024.06		61.61
ChatGPT-DA 2024.06		60.34
SummaC 2024.06		49.7
QuestEval 2024.06		49.47
SummaC-Conv 2024.06		46.92
QAFactEval 2024.06		39.84