Українська національна LLM вийде в бета-тестування навесні 2026 року – що відомо
Ілюстративне фото: Depositphotos

Україна навесні 2026 року запустить бета-тестування першої національної великої мовної моделі LLM, яку навчають на унікальних українських даних. Технічним партнером проєкту став оператор "Київстар", який фінансує розробку та передасть модель державі. Про це повідомляє Мінцифра.

Модель створюють на базі відкритої LLM від Google – Gemma, адаптуючи її під українську мову та контекст. До тестування залучена незалежна група експертів, яка перевіряє технічну якість, етичність, знання мови та розуміння українських реалій.

Наразі команда збирає терабайти даних для навчання моделі – не лише з інтернету, а й із медіа, університетів та державних органів. Також розробляється юридичний фреймворк для безпечної роботи з даними, а експерти вже формують власні українські бенчмарки.

У січні буде готова перша база текстів, покращений токенізатор і система оцінювання. Навесні розпочнеться публічне тестування, а назву для LLM українці обиратимуть самі через голосування в застосунку "Дія".

Нещодавно в грудні 2025 року Україна почала збір даних для навчання ШІ-моделі з понад 90 держустанов. Також в Україні сформували команду для розробки національної великої мовної моделі.