用户名/邮箱
登录密码
验证码
看不清?换一张
您好,欢迎访问! [ 登录 | 注册 ]
您的位置:首页 - 最新资讯
Дипфейк: что это, как распознать, история и примеры использования технологии
2022-10-12 00:00:00.0     Наука и техника(科学和技术)     原网页

       

       Нейросети, генерирующие изображения по текстовым запросам, стали одним из самых громких трендов последних лет — но далеко не таким противоречивым, как технология deepfake. Возможность заменить внешность человека на видео или создать ролик, где снимется погибший актер, вызывает горячие дискуссии со всех сторон вопроса: недавно отечественные рекламщики из Agenda Media Group даже сняли веб-сериал, где снялись цифровые двойники Джейсона Стейтема, Марго Робби и Киану Ривза. Разбираемся, как работают deepfake и можно ли распознать фейк невооруженным взглядом.

       Фото: Скриншот Скриншот

       Что такое deepfake

       Видео дня

       Если не слишком вдаваться в технические подробности, англоязычным термином deepfake называют различный медиа-контент (чаще всего видео), где внешность и/или голос одного человека искусственно заменены внешностью и/или голосом другого. Например, в нашумевшем короткометражном фильме In Event of Moon Disaster, где высадка Нила Армстронга на Луну закончилась катастрофой, президент США Ричард Никсон зачитывает срочное обращение к народу. Он выглядит и звучит точь-в-точь, как реальный президент — но его сыграл другой актер, чьи голос и внешность заменили.

       Создание термина присваивают одноименному пользователю интернет-форума Reddit, который в 2017 году выложил на платформе ролики порнографического характера, где лица актрис были заменены на внешность знаменитостей. Впрочем, эксперименты в этой области начались гораздо раньше, еще в конце 1990-х. Разработчики уже тогда занимались созданием программ, способных подгонять искусственную мимику под аудиодорожки — чтобы не было расхождений. Разница лишь в том, что раньше подобные технологии были доступны лишь узкому кругу специалистов, тогда как сейчас для тех же целей применяются нейросети: их исходный код нередко выкладывается в Сеть бесплатно для всех желающих.

       Как работают deepfake

       Специальные алгоритмы, работающие на базе нейросетей, синтезируют видео и звук при помощи машинного обучения. Они изучают сотни тысяч образцов голоса и внешности, чтобы собрать необходимый объем информации: мимику, черты лица, привычки, естественные позы, тембр речи и так далее. После этого обученный алгоритм может обработать видео, распознать нужные элементы и заменить их. Например, вырезать лицо Маколея Калкина из ?Один дома? и вставить вместо него внешность Сильвестра Сталлоне.

       Популярность фейковых роликов со знаменитостями не случайна. Нейросети обучаются на примере интервью, фильмов, записях живых выступлений, подкастах и прочем контенте, который очень легко можно найти в Интернете, причем в большом количестве. Впрочем, на основе таких данных едва ли получится создать по-настоящему качественный фейк. Серьезные компании, специализирующиеся на визуальных эффектах, подходят к вопросу иначе: они приглашают актеров, записывают видеоматериал в тщательно контролируемых условиях, просят героев прочитать заранее подготовленный текст — чтобы нейросеть получила хорошие образцы.

       Собственно, на данный момент именно киноиндустрия и выступает ключевой областью применения deepfake. Благодаря этой технологии студии могут заставить пожилых актеров выглядеть значительно моложе своих лет, как это было в фильме ?Ирландец? Мартина Скорсезе, или вообще ?воскресить? мертвого человека на экране. Например, Питера Кушинга, чей цифровой двойник сыграл в ?Изгой-один: Звездные войны. Истории?. Синтез речи также часто используется для создания голосовых помощников, автоответчиков и других инструментов сферы обслуживания.

       Как распознать deepfake

       Чем совершеннее технологии, тем сложнее отличить убедительный deepfake от реальности. Однако в ближайшем будущем они вряд ли избавятся от всех недостатков: если знать, на что обращать внимание, то распознать обработанное видео не слишком сложно. Так, сотрудник медиалаборатории Массачусетского технологического института Мэтт Гро рекомендует присматриваться к следующим нюансам.

       Лицо. Моргает ли человек на видео слишком часто или слишком редко? Помещаются ли их брови на их лице? Нет ли волос в неправильном месте? Не выглядит ли их кожа слишком гладкой или морщинистой? Голос. Подходит ли голос внешности? Нормально ли звучит тембр и дикция? Освещение. Отбрасывают ли очки человека корректные блики? Как смотрится свет, падающий на лицо?

       


标签:综合
关键词: человека     слишком     голос     чтобы     видео     внешность    
滚动新闻
    相关新闻