Мінцифра оголосила збір українськомовних текстів для національного ШІ – як долучитися

Для навчання української LLM необхідні тексти з новин, блогів, технічної документації, підручників

Анастасія Бобкова

Редакторка новин LIGA.net

28 січня, 17:50

Ілюстративне фото: (Фото: Depositphotos)

Міністерство цифрової трансформації України разом із Київстар оголосили про збір якісних українськомовних даних для створення національної великої мовної моделі (LLM). Це буде основа для аналогів ChatGPT чи Gemini, адаптованих до українських реалій. Про це повідомляє Мінцифри.

Організатори шукають партнерів із бізнесу, медіа, освіти, науки та культури. Зокрема, потрібні новини, блоги, технічна документація, підручники, наукові тексти, художня література, архівні матеріали та інший контент українською мовою. Надані дані ляжуть в основу ШІ, який працюватиме у держсекторі й комерційному середовищі.

Відключити

Читайте також

Україна створює національну LLM. Навіщо державі мовна модель і що про неї думає бізнес

Учасникам гарантують прозорі, що контент використовуватиметься виключно для навчання моделі, а права інтелектуальної власності будуть захищені. Авторів і організації, що долучаться до проєкту, офіційно згадають у звіті про створення LLM.

Щоб долучитися, потрібно заповнити коротку форму та вказати, які саме дані ви готові надати.

Нещодавно стало відомо, що українська національна LLM вийде в бета-тестування навесні 2026 року. В грудні 2025 року Україна почала збір даних для навчання ШІ-моделі з понад 90 держустанов.

Коментарі

Щоб долучитись до дискусії, та активуйте підписку.

Упс, виникла помилка. Спробуйте пізніше.