OpenAI улучшила генератор изображений в ChatGPT, но проблемы остаются
Интерфейс ChatGPT (Фото: Depositphotos)

Компания OpenAI улучшила генерацию изображений в своем ChatGPT. Теперь бот использует модель GPT-4o вместо DALL-E 3, которая появилась еще в 2023 году. Об этом сообщили на сайте компании.

GPT‑4o выпустили в 2024 году, но до сих пор использовали только для генерации текста. Теперь она умеет создавать картинки по запросу, в частности, вносить правки после следующих инструкций. В OpenAI пишут, что GPT-4o может обрабатывать до 10-20 разных объектов.

Чтобы дать модели контекст, можно загрузить выбранные фото в качестве примера. Проблемы в ее работе тоже остаются. Картинки могут получаться обрезанными, бот может галлюцинировать и не умеет точно воспроизводить более 20 элементов.

Проблеми зі створенням періодичної таблиці хімічних елементів (Фото: OpenAI)
Проблемы с созданием периодической таблицы химических элементов (Фото: OpenAI)

GPT-4o не создает картинки, нарушающие политику компании. В частности, сцены сексуального характера. Также OpenAI ограничивает генерацию дипфейков с обнаженными телами или сценами насилия.

Модель для изображений уже доступна пользователям без подписки и с ней, пишут в OpenAI. В скором времени к ней появится доступ у подписчиков Enterprise и Edu. Доступ к модели через API будет открыт в течение нескольких недель.