Інтерфейс ChatGPT (Фото: Depositphotos)

Компанія OpenAI покращила генерацію зображень у своєму ChatGPT. Тепер бот використовує модель GPT‑4o замість DALL-E 3, яка з'явилася ще у 2023 році. Про це повідомили на сайті компанії.

GPT‑4o випустили у 2024 році, але досі використовували лише для генерації тексту. Тепер вона вміє створювати картинки за запитом, зокрема, вносити правки після наступних інструкцій. В OpenAI пишуть, що GPT‑4o може обробляти до 10-20 різних об’єктів.

Щоб дати моделі контекст, можна завантажити обрані фото як приклад. Проблеми у її роботі теж лишаються. Картинки можуть виходити обрізаними, бот може галюцинувати й не вміє точно відтворювати більш як 20 елементів.

Проблеми зі створенням періодичної таблиці хімічних елементів (Фото: OpenAI)

GPT-4o не створює картинки, які порушують політику компанії. Зокрема, сцени сексуального характеру. Так само OpenAI обмежує генерацію дипфейків з оголеними тілами чи сценами насильства.

Модель для зображень уже доступна користувачам без підписки та з нею, пишуть в OpenAI. Незабаром до неї з’явиться доступ у підписників Enterprise та Edu. Доступ до моделі через API відкриють протягом кількох тижнів.