PLLuM: A Family of Polish Large Language Models

About

Large Language Models (LLMs) play a central role in modern artificial intelligence, yet their development has been primarily focused on English, resulting in limited support for other languages. We present PLLuM (Polish Large Language Model), the largest open-source family of foundation models tailored specifically for the Polish language. Developed by a consortium of major Polish research institutions, PLLuM addresses the need for high-quality, transparent, and culturally relevant language models beyond the English-centric commercial landscape. We describe the development process, including the construction of a new 140-billion-token Polish text corpus for pre-training, a 77k custom instructions dataset, and a 100k preference optimization dataset. A key component is a Responsible AI framework that incorporates strict data governance and a hybrid module for output correction and safety filtering. We detail the models' architecture, training procedures, and alignment techniques for both base and instruction-tuned variants, and demonstrate their utility in a downstream task within public administration. By releasing these models publicly, PLLuM aims to foster open research and strengthen sovereign AI technologies in Poland.

Jan Koco\'n, Maciej Piasecki, Arkadiusz Janz, Teddy Ferdinan, {\L}ukasz Radli\'nski, Bart{\l}omiej Koptyra, Marcin Oleksy, Stanis{\l}aw Wo\'zniak, Pawe{\l} Walkowiak, Konrad Wojtasik, Julia Moska, Tomasz Naskr\k{e}t, Bartosz Walkowiak, Mateusz Gniewkowski, Kamil Szyc, Dawid Motyka, Dawid Banach, Jonatan Dalasi\'nski, Ewa Rudnicka, Bart{\l}omiej Alberski, Tomasz Walkowiak, Aleksander Szcz\k{e}sny, Maciej Markiewicz, Tomasz Berna\'s, Hubert Mazur, Kamil \.Zyta, Mateusz Tykierko, Grzegorz Chodak, Tomasz Kajdanowicz, Przemys{\l}aw Kazienko, Agnieszka Karli\'nska, Karolina Seweryn, Anna Ko{\l}os, Maciej Chrab\k{a}szcz, Katarzyna Lorenc, Aleksandra Krasnod\k{e}bska, Artur Wilczek, Katarzyna Dziewulska, Paula Betscher, Zofia Cie\'sli\'nska, Katarzyna Kowol, Daria Miko\'s, Maciej Trzci\'nski, Dawid Krutul, Marek Koz{\l}owski, S{\l}awomir Dadas, Rafa{\l} Po\'swiata, Micha{\l} Pere{\l}kiewicz, Ma{\l}gorzata Gr\k{e}bowiec, Maciej Kazu{\l}a, Marcin Bia{\l}as, Roman Roszko, Danuta Roszko, Jurgita Vai\v{c}enonien\.e, Andrius Utka, Pawe{\l} Levchuk, Pawe{\l} Kowalski, Irena Prawdzic-Jankowska, Maciej Ogrodniczuk, Monika Borys, Anna Buli\'nska, Wiktoria Gumienna, Witold Kiera\'s, Dorota Komosi\'nska, Katarzyna Krasnowska-Kiera\'s, {\L}ukasz Kobyli\'nski, Martyna Lewandowska, Marek {\L}azi\'nski, Miko{\l}aj {\L}\k{a}tkowski, Dawid Mastalerz, Beata Milewicz, Agnieszka Anna Mykowiecka, Angelika Peljak-{\L}api\'nska, Sandra Penno, Zuzanna Przybysz, Micha{\l} Rudolf, Piotr Rybak, Karolina Saputa, Aleksandra Tomaszewska, Aleksander Wawer, Marcin Woli\'nski, Joanna Wo{\l}oszyn, Alina Wr\'oblewska, Bartosz \.Zuk, Filip \.Zarnecki, Konrad Kaczy\'nski, Anna Cichosz, Zuzanna Deckert, Monika Garnys, Izabela Grabarczyk, Wojciech Janowski, Sylwia Karasi\'nska, Aleksandra Kujawiak, Piotr Misztela, Maria Szyma\'nska, Karolina Walkusz, Igor Siek, Jakub Kwiatkowski, Piotr P\k{e}zik• 2025

Related benchmarks

Task	Dataset	Result
Emotional Intelligence	Polish EQ-Bench	Overall Score72.56	106
Polish Text Understanding	CPTUB	Overall Avg3.67	98
Linguistic and Cultural Competency	Polish Linguistic and Cultural Competency Benchmark (PLCC)	Avg Score69.67	52
Multilingual Language Proficiency	INCLUDE base 44	Average Score44.2	46
Polish Board Certification Examinations	speakleash/PES 2018-2022	Average Score38.53	32
Medical Knowledge Performance	Polish Board Certification Examinations (test)	Average Score (%)38.53	29
Language Understanding	INCLUDE base 44	Average Score44.2	21

Showing 7 of 7 rows

Other info

Follow for update

@wizwand_team Discord