Україна почала збір даних для навчання ШІ-моделі з понад 90 держустанов

Україна збирає дані з понад 90 державних установ, зокрема судових реєстрів, освітніх видавництв, регіональних архівів і матеріалів, що стосуються дій Росії під час повномасштабного вторгнення. Ці дані стануть основою для навчання національної мовної моделі штучного інтелекту, створеної на базі відкритої архітектури Gemma від Google. Про це повідомляє інформаційна агенція Reuters.
Навчання відбуватиметься за межами України на захищених графічних процесорах, які надає компанія Google. Після завершення, готову модель планують розмістити у локальних дата-центрах. Київстар виступає одним із технологічних партнерів проєкту, однак точну дату запуску поки не підтверджено.
Розробники готуються до потенційних кібератак. У Мінцифри зазначають, що одразу після публічного запуску система може стати мішенню, як це відбувалося з іншими ШІ-сервісами. Зокрема, розглядаються методи захисту від "prompt injection" – спроб вбудувати шкідливі інструкції у користувацькі запити.
Нещодавно стало відомо, що українську LLM натренують на базі моделі Gemma від Google. А в Україні сформували команду для розробки національної великої мовної моделі.


Коментарі (0)