OpenAI покращила генератор зображень у ChatGPT, але проблеми лишаються
Компанія OpenAI покращила генерацію зображень у своєму ChatGPT. Тепер бот використовує модель GPT‑4o замість DALL-E 3, яка з'явилася ще у 2023 році. Про це повідомили на сайті компанії.
GPT‑4o випустили у 2024 році, але досі використовували лише для генерації тексту. Тепер вона вміє створювати картинки за запитом, зокрема, вносити правки після наступних інструкцій. В OpenAI пишуть, що GPT‑4o може обробляти до 10-20 різних об’єктів.
Щоб дати моделі контекст, можна завантажити обрані фото як приклад. Проблеми у її роботі теж лишаються. Картинки можуть виходити обрізаними, бот може галюцинувати й не вміє точно відтворювати більш як 20 елементів.
GPT-4o не створює картинки, які порушують політику компанії. Зокрема, сцени сексуального характеру. Так само OpenAI обмежує генерацію дипфейків з оголеними тілами чи сценами насильства.
Модель для зображень уже доступна користувачам без підписки та з нею, пишуть в OpenAI. Незабаром до неї з’явиться доступ у підписників Enterprise та Edu. Доступ до моделі через API відкриють протягом кількох тижнів.