Share your thoughts, 1 month free Claude Pro on usSee more

Masked Language Modeling on BERT Pretraining Corpus

2.89Perplexity

gMLP_xlarge

Updated 4mo ago

Evaluation Results

Method	Links
gMLP_xlarge 2021.05		2.89
aMLP_large 2021.05		3.19
gMLP_large 2021.05		3.32
BERT_large (ours) 2021.05		3.35
aMLP_base 2021.05		3.95
BERT_base (ours) 2021.05		4.17
gMLP_base 2021.05		4.28