Нейросеть заговорила голосами знаменитостей

Как мошенники могут использовать технологию синтеза речи для распространения фейк-ньюс

Компания Тимура Бекмамбетова научила нейросеть говорить голосами знаменитостей. Проект Vera Voice анализирует речь любого человека, например, артиста и озвучивает его голосом любые тексты. Разработчики отмечают, что уже создали инструмент для защиты прав обладателей голоса и готовы отслеживать голосовых клонов-мошенников. Как именно это будет реализовано, они не сообщили. Известно, что со знаменитостями заключат договоры о партнерстве. Как можно применить технологию и какие риски она несет? Разбирался Илья Сизов.

Фото: Юрий Мартьянов, Коммерсантъ

Маркетологи давно поняли, что использование медийных персонажей в проектах неизменно привлекает внимание аудитории к продукту и, как следствие, приумножает выручку. Россиянам не в новинку слушать правила поведения на борту самолета, озвученные Гариком Харламовым, или ехать в машине, где штурманом выступает голос Михаила Боярского или рэпера Басты.

Правда, расходы на проект от привлечения звезд разной величины также возрастают: и гонорар надо заплатить, и под график знаменитости подстроиться. К некоторым подобраться почти невозможно. Но создателям проекта Vera Voice удалось.

Ни Владимир Путин, ни Владимир Познер, ни Ксения Собчак лично в проекте не участвовали — нейросеть добралась до многочисленных записей их голосов, которые нетрудно найти в сети, и научилась имитировать тембр, интонации и прочие нюансы речи знаменитостей. В теории озвучить так можно что угодно, в том числе то, что обладатели голосов ни при каких обстоятельствах произносить не хотели бы. При этом создатели проекта уверяют, что определить, синтезированная запись или оригинальная, технически возможно, но как именно — не уточняют.

Случаи распространения фейк-ньюс могут участиться, но это меньшее из всех возможных негативных последствий, отметил технический директор российского офиса Trend Micro Михаил Кондрашин: «Не стоит полагать, что новые технологии могут угрожать только популярным личностям.

Образцы голоса могут быть украдены у кого угодно.

Например, при помощи вредоносной программы в телефоне, голосового помощника и других ненадежных средств передачи голоса. Злоумышленники уже собирают образцы голоса в преддверии введения биометрической аутентификации. При наличии таких программ они будут делать массивы данных, чтобы потом осуществлять свои мошеннические звонки. И когда вы будете слушать голос какого-то родственника, знакомого, которые вас будут побуждать к каким-то действиям, это может навредить».

ИТ-специалисты обеспокоены: потенциально опасные разработки день ото дня становится все доступнее и каждый может попасть в зону риска. Директор по науке и технологиям Агентства искусственного интеллекта Роман Душкин уверен, что массовое использование нейросетей для синтеза голоса куда ближе, чем кажется на первый взгляд: «Обучение нейронных сетей сейчас идет на том же оборудовании, на котором все майнили биткойны. Сейчас все будут заниматься обучением нейронных сетей. Сначала нейронная сеть обучается тому, как это в принципе делать на произвольных данных.

Последовательность звуков – это тот же бит.

Их надо выстраивать – и нейросеть сначала будет делать это без использования интонации, нюансов, по которым можно определять человека. Потом при помощи голоса конкретного человека уже предобученная нейронная сеть будет настраиваться на определенные интонации».

Как нейросеть генерирует псевдоконтент, который могут распознать только специалисты

Смотреть

Впрочем, снизить риск быть жертвой мошенников все же возможно. Чтобы не допустить катастрофы, опрошенные "Ъ FM" эксперты не советуют банкам проводить операции, полагаясь только на биометрические данные своих клиентов, особенно — голос. Обычным же людям не рекомендуется устанавливать на свои гаджеты приложения от неизвестных разработчиков. А общаясь с кем-то из знакомых по телефону, стоит на всякий случай задавать собеседнику кодовый вопрос, ответ на который знает только этот человек.

Летом технологию по синтезу голоса представил Facebook — разработчики научили нейросеть говорить голосом Билла Гейтса. В сентябре о похожей разработке рассказали в Amazon. Голосовой помощник компании Alexa может общаться со своими владельцами голосом актера Сэмюэля Л. Джексона, а к следующему году освоит речь и других знаменитостей.

Вся лента