Скриншот YouTube

Компания Nvidia представила на GTC 2019 программное обеспечение, которое создавать фотореалистичные изображения из простых эскизов. Об этом сообщает TechCrunch.

Программное обеспечение GauGAN - это демонстрация того, что возможно делать с помощью платформ нейронных сетей Nvidia. В несколько нажатий мышью человек может сделать эскиз и превратить его в фотореалистичное изображение за считанные секунды. 

У GauGAN всего три инструмента, как у многих графических редакторов: ведро с краской (заливка), ручка и карандаш. В нижней части экрана находится серия объектов. Нужно выбрать объект, нарисовать линию одним из инструментов - и программа создаст изображение. Причем, если два пользователя создают один и тот же эскиз с одинаковыми настройками, программное обеспечение даст разные результаты.

Для получения результатов в реальном времени GauGAN должен работать на вычислительной платформе Tensor. Однако Брайан Катандзаро, вице-президент Applied Deep Learning Research, заявил, что с некоторыми изменениями GauGAN может работать практически на любой платформе.

Nvidia использовала 1 миллион изображений на Flickr для обучения нейронной сети. Компания сообщает, что программа может синтезировать сотни тысяч объектов и их связь с другими объектами в реальном мире. Например, если сменить сезон в GauGAN, листья исчезнут с веток. Или, если перед деревом есть пруд, дерево будет отражаться в воде. В демоверсии границы между объектами не идеальны, но команда проекта заявляет, что это улучшится. 

Компания не планирует выпускать GauGAN на коммерческой основе, но вскоре может выпустить публичную пробную версию, чтобы позволить кому-либо использовать программное обеспечение. Как, например, уже выпустила фан-продукт для генерации лиц людей. Есть и подобный проект - по созданию нейросетью изображений котов. К слову, результаты последнего оказались довольно страшны