В московском Центре искусственного интеллекта Samsung прошла презентация работы нового типа генеративно-состязательных нейросетей. От прошлого поколения ее отличает добавление третьего уровня обработки изображений, что позволяет «оживить» любую картину. Это новый уровень «дипфейков» – имитационных видео с высокой степенью реалистичности.
В составе нового ИИ три подсистемы. Нейросеть «Embedder» изучает исходные изображения для определения ключевых точек, подвижных частей и создания векторов их смещения. В случае с портретом человека это губы, глаза, наклон лица, движение скул и т.д. Затем нейросеть «Generator» на основе этих векторов генерирует различные варианты изображений, которые от исходного отличает смещение отдельных частей. Например, палитра эмоций и гримас.
Далее в работу вступает третья нейросеть «Discriminator», которая анализирует итоговые видео на предмет дефектов, несоответствий и общей недостоверности. Поэтапная работа всего комплекса приводит к созданию поддельных видео высокого уровня реализма. Специализацией этого ИИ является сложная анимация не просто статичных объектов, а таких, которые изначально никто и не предполагал увидеть в движении. Например, ему под силу «оживить» Мону Лизу с известной картины.
Перед нами наглядный пример имитационных видео нового уровня. Одно дело заставить улыбнуться человека в кадре или «надеть» на персонажа в видео шляпу, то есть повторить те действия, которые они могли бы совершить в реальности. И другое – изобразить то, чего никогда не было, и большинство людей может только представлять, как это должно выглядеть. Однако новый ИИ не просто справляется с этой работой, но и заставляет зрителей поверить в реалистичность своих подделок.