Ілюстративне фото: (Фото: Depositphotos)

Міністерство цифрової трансформації України разом із Київстар оголосили про збір якісних українськомовних даних для створення національної великої мовної моделі (LLM). Це буде основа для аналогів ChatGPT чи Gemini, адаптованих до українських реалій. Про це повідомляє Мінцифри.

Організатори шукають партнерів із бізнесу, медіа, освіти, науки та культури. Зокрема, потрібні новини, блоги, технічна документація, підручники, наукові тексти, художня література, архівні матеріали та інший контент українською мовою. Надані дані ляжуть в основу ШІ, який працюватиме у держсекторі й комерційному середовищі.

Учасникам гарантують прозорі, що контент використовуватиметься виключно для навчання моделі, а права інтелектуальної власності будуть захищені. Авторів і організації, що долучаться до проєкту, офіційно згадають у звіті про створення LLM.

Щоб долучитися, потрібно заповнити коротку форму та вказати, які саме дані ви готові надати.

Нещодавно стало відомо, що українська національна LLM вийде в бета-тестування навесні 2026 року. В грудні 2025 року Україна почала збір даних для навчання ШІ-моделі з понад 90 держустанов.