У канала @deeptomcruise в TikTok, на котором можно увидеть потрясающие по качеству дипфейки Тома Круза, множество просмотров и подписчиков, большая часть из которых искренне верит в торжество высоких технологий и искусственного интеллекта. Дескать, стоит нажать пару кнопок и нейросеть сама за считанные минуты нарисует и смонтирует дипфейк, который не отличить от реального видео. Бельгийский специалист по визуальным эффектам Крис Уме, который и является автором этих видео, авторитетно заявляет – все гораздо, гораздо сложнее.
Дипфейки не создаются по щелчку пальцев и даже наличие суперкомпьютера вам никак не поможет, потому что механизм работы нейросети слишком примитивен, несмотря на постоянное развитие. В случае с пародиями на Тома Круза главную роль исполнил актер Майлз Фишер, который и до этого имитировал голливудскую звезду. Они схожи визуально, плюс Фишер идеально пародирует, преувеличенно демонстрирует эмоции в кадре, что и позволяет показать «Тома Круза» таким, каким его подсознательно хочет увидеть зритель.
Уме использовал нейросеть с открытым кодом DeepFaceLab, собрал систему из двух видеокарт NVIDIA RTX 8000, и два месяца подряд обучал ее только распознаванию облика Тома Круза. Затем изготовил видео первичных грубых дипфейков, которые потом в течение нескольких недель редактировал вручную буквально по кадрам, исправляя иногда всего несколько пикселей, которые портили картинку. И все равно итоговые видео полны огрехов, просто неискушенный зритель их не замечает.
Нет сомнений, что в будущем качество и скорость работы ИИ для создания дипфейков улучшится, но ожидать массового наплыва качественного контента такого рода не приходится. Впрочем, Крис Уме не исключает обратной ситуации, по аналогии с распространением Photoshop 20 лет назад, и появлением массы грубо отретушированных снимков. Если изначально люди не знали о технологии и удивлялись странным фотографиям, то потом быстро освоились и начали легко распознавать и высмеивать неумелые подделки. С дипфейками, вполне возможно, будет так же.