Нейросеть GauGAN 2.0 от Nvidia научилась рисовать картины по словесному описанию

29 ноября 2021

Компания Nvidia разработала и показала искусственный интеллект для создания фотореалистичных изображений под названием GauGAN еще в 2019-м. Но форму полноценного инструмента, доступного широкой публике, нейросеть обрела только недавно в виде приложения Canvas. И вот вышла версия GauGAN 2.0, которая теперь умеет распознавать словесные описания того, что вы хотите нарисовать.

Главная особенность GauGAN не только в распознавании сути пользовательских запросов, но и внимании к деталям, которые они хотели бы отразить. В идеале, она может на основе текстовых и графических указаний поменять произвольным образом форму, размер и текстуру любого объекта на рисунке. И при этом сохранить общую гармоничность и целостность полотна, которое в итоге выглядит как фотография или искусная картина.

Чтобы ИИ так тонко понимал человеческие запросы, генеративно-состязательную модель обучали на примерах 10 млн различных пейзажей. Поэтому она понимает, чем отличается «припорошенный грязью валун на берегу» от «перекатывающихся камней в прибое», и может нарисовать и то, и другое в одном кадре. Что еще интереснее, изменения отображаются в реальном времени, по мере составления запроса. Зайдите на сайт нейросети и почувствуйте себя творцом!

Нейросеть GauGAN 2.0 от Nvidia научилась рисовать картины по словесному описанию

Читайте также