Open PL LLM Leaderboard

Benchmarks

Task Name	Dataset Name	SOTA Result
Polish Instruction Following	Open PL LLM Leaderboard	Average Score69.84	45
Large Language Model Evaluation	Open PL LLM Leaderboard instruction-tuned	Overall Average Score69.84	44
Linguistic Implicatures Decoding	Open PL LLM Leaderboard Implicatures component base models	Average Score67.38	30

Showing 3 of 3 rows