Meeting claim evaluation on private_data (test)

74.5Accuracy

gpt-5.4

Updated 3mo ago

Evaluation Results

Method	Links
gpt-5.4 2026.04		74.5	86.5	92
gpt-4.1 2026.04		72.9	80.1	81.6