Apple запустила ШІ, який може редагувати фото за допомогою команд текстом
Компанія Apple запустила нову модель штучного інтелекту відкритим кодом для редагування зображень. Модель під назвою MLLM-Guided Image Editing (MGIE) дає можливість редагувати фотографії за допомогою тексту, який вводить користувач.
Компанія розробила MGIE спільно з дослідниками з Каліфорнійського університету в Санта-Барбарі. Модель перетворює прості або неоднозначні текстові підказки на детальніші та зрозуміліші інструкції. Наприклад, якщо користувач хоче відредагувати фотографію піци з пепероні, щоб зробити її "більш здоровою", модель може інтерпретувати це як "додати овочеву начинку" на фото.
Окрім внесення значних змін до зображень, MGIE також може обрізати, змінювати розмір і обертати фотографії, а також покращувати їх яскравість, контраст і баланс кольорів за допомогою текстових підказок. Вона також може редагувати окремі ділянки фотографії та, наприклад, змінювати колір волосся, очей та одяг людини, або видаляти елементи на фоні.
Apple випустила модель на GitHub, але зацікавлені також можуть спробувати демоверсію, яка зараз розміщена на Hugging Face Spaces.