Apple запустила ИИ, который может редактировать фото с помощью команд текстом
Компания Apple запустила новую модель искусственного интеллекта открытым кодом для редактирования изображений. Модель под названием MLLM-Guided Image Editing (MGIE) позволяет редактировать фотографии с помощью текста, который вводит пользователь.
Компания разработала MGIE совместно с исследователями из Калифорнийского университета в Санта-Барбаре. Модель преобразует простые или неоднозначные текстовые подсказки в более подробные и понятные инструкции. Например, если пользователь хочет отредактировать фотографию пиццы из пепперони, чтобы сделать ее "более здоровой", модель может интерпретировать это как "добавить овощную начинку" на фото.
Помимо внесения значительных изменений в изображения, MGIE также может обрезать, изменять размер и вращать фотографии, а также улучшать их яркость, контраст и баланс цветов с помощью текстовых подсказок. Она также может редактировать отдельные области фотографии и, например, изменять цвет волос, глаз и одежду человека или удалять элементы на фоне.
Apple выпустила модель на GitHub, но заинтересованные также могут попробовать демо-версию, которая сейчас размещена на Hugging Face Spaces.