Share your thoughts, 1 month free Claude Pro on usSee more

Natural Language Inference on SciTail (test)

96.8Accuracy

ALUM_ROBERTA-LARGE-SMART

Updated 2mo ago

Evaluation Results

Method
ALUM_ROBERTA-LARGE-SMART 2020.04	96.8	-	-
ALUM_ROBERTa-SMART 2020.09	96.8	-	-
CA-MTL_ROBERTa 2020.09	96.8	-	-
ALUM_ROBERTA-LARGE 2020.04	96.3	-	-
ALUM_ROBERTa 2020.09	96.3	-	-
UNIFIED-IO XL 2022.06	95.7	-	-
MT-DNN-SMART_LARGE_V0 2019.11	95.2	-	-
MT-DNN_LARGE 2019.11	95	-	-
MT-DNN 2019.01	95	-	-
MT-DNN_LARGE 2020.04	95	-	-
SMART_BERT-LARGE 2019.11	94.7	-	-
BERT_LARGE 2019.11	94.4	-	-
BERT 2019.01	94.4	-	-
BERT_LARGE 2020.04	94.4	-	-
MT-DNN-SMART_BASE 2019.11	94.2	-	-
MT-DNN_BASE 2019.11	94.1	-	-
MT-DNN 2019.01	94.1	-	-
MT-DNN 2020.09	94.1	-	-
MT-DNN-SMART_BASE_V0 2019.11	94	-	-
HYPERFORMER++_BASE 2021.06	93.4	-	-
SMART_BERT-BASE 2019.11	93.2	-	-
UNIFIED-IO LARGE 2022.06	93.1	-	-
Adapters_BASE 2021.06	92.72	-	-
DEBERTa 2022.06	92.4	-	-
HYPERFORMER++_BASE 2021.06	92.34	-	-
BERT_BASE 2019.11	92	-	-
BERT 2019.01	92	-	-
Adapters_BASE 2021.06	91.75	-	-
HYPERFORMER++_BASE 2021.06	91.44	-	-
Adapters_BASE 2021.06	91.27	-	-
T5_BASE 2021.06	91.01	-	-
UNIFIED-IO BASE 2022.06	90.8	-	-
DEIM 2022.03	89.5	-	-
T5_BASE 2021.06	88.77	-	-
HYPERFORMER++_BASE 2021.06	88.52	-	-
SAN 2018.04	88.4	-	-
GPT 2019.11	88.3	-	-
GPT 2018.04	88.3	-	-
GPT 2019.01	88.3	-	-
GPT 2020.04	88.3	-	-
Transformer LM 2022.03	88.3	-	-
Adapters_BASE 2021.06	88.22	-	-
T5_BASE 2021.06	88.07	-	-
DRr-Net 2022.03	87.4	-	-
UNIFIED-IO SMALL 2022.06	87.4	-	-
CSRAN 2019.08	86.7	-	-
RE2 2022.03	86.6	-	-
HYPERFORMER++_BASE 2021.06	86.55	-	-
RE2 2019.08	86	-	-
HBMP 2018.08	86	-	-
HYPERFORMER++_BASE 2021.06	85.85	-	-
InferSent 2018.08	85.1	-	-
Adapters_BASE 2021.06	85.06	-	-
T5_BASE 2021.06	84.04	-	-
CAFE 2017.12	83.3	-	-
CAFE 2019.08	83.3	-	-
CAFE 2018.08	83.3	-	-
Adapters_BASE 2021.06	83.25	-	-
HYPERFORMER++_BASE 2021.06	82	-	-
T5_BASE 2021.06	81.97	-	-
T5_BASE 2021.06	80.03	-	-
HCRN 2019.08	80	-	-
T5_BASE 2021.06	79.6	-	-
Adapters_BASE 2021.06	79.54	-	-
Final-exit 2023.09	78.9	28.3	-
DGEM + Edge 2017.12	77.3	-	-
Khot et al. 2018.04	77.3	-	-
DGEM 2019.08	77.3	-	-
DGEM 2018.08	77.3	-	-
DecompAtt 2017.12	72.3	-	-
DecompAtt 2019.08	72.3	-	-
DecompAtt 2018.08	72.3	-	-
DGEM 2017.12	70.8	-	-
DGEM w/o edges 2018.08	70.8	-	-
NGRAM 2017.12	70.6	-	-
ESIM 2017.12	70.6	-	-
ESIM 2019.08	70.6	-	-
ESIM 2018.08	70.6	-	-
Ngram 2018.08	70.6	-	-
ESIM 2022.03	70.6	-	-
Majority 2017.12	60.3	-	-
SplitEE 2023.09	0	-49.2	-
SplitEE-S 2023.09	0	-50.5	-
ElasticBERT 2023.09	-0.1	-40.2	-
Random-exit 2023.09	-0.7	-31.8	-
DeeBERT 2023.09	-3.6	-5.3	-
Random 2024.08	-	-	54.9
Random 2024.08	-	-	75.6
SPoT 2024.08	-	-	70.4
SPoT 2024.08	-	-	87.8
SPoT 2024.08	-	-	57.7
SPoT 2024.08	-	-	77.7
SPoT 2024.08	-	-	70.4
SPoT 2024.08	-	-	87.7
ATTEMPT 2024.08	-	-	63.8
ATTEMPT 2024.08	-	-	83.6
Task Prompt Vectors 2024.08	-	-	71.5
Task Prompt Vectors 2024.08	-	-	88.1