Share your thoughts, 1 month free Claude Pro on usSee more

Temporal Question Answering on ReasonQA Single-hop

95.1Set Accuracy

T5-large PIT-SFT

Updated 5mo ago

Evaluation Results

Method	Links
T5-large PIT-SFT 2023.11		95.1	95.6
T5-base PIT-SFT 2023.11		91.6	93.8
T5-large SFT 2023.11		86	88.1
T5-base SFT 2023.11		80.4	83.3
GPT-4 2023.11		67.1	80.2
FLAN-T5-XL 2023.11		61.5	64.1
GPT-3.5 2023.11		28	45.3