Коммерсантъ FM

У дикторов крадут голоса

Представители отрасли просят о регулировании технологий синтеза речи

Союз дикторов просит Госдуму установить специальное регулирование синтеза человеческого голоса с помощью технологий искусственного интеллекта (ИИ). Дикторы говорят о случаях кражи их голосов и опасаются снижения доходов на фоне распространения технологий. Предлагается, в частности, ввести лицензии на использование определенного голоса. Компании, синтезирующие речь, говорят, что заботятся о легитимности технологии. Но юристы подтверждают, что голос никак не защищен от копирования.

Фото: Юрий Мартьянов, Коммерсантъ

Фото: Юрий Мартьянов, Коммерсантъ

“Ъ” ознакомился с копией письма Союза дикторов России главе комитета Госдумы по информполитике Александру Хинштейну от 26 января. Дикторы предлагают в нем разработать регулирование синтеза голосов с помощью ИИ. В союзе подтвердили подлинность письма, господин Хинштейн заявил “Ъ”, что пока его не получал.

Речь идет о технологиях, которые копируют голос человека на основе звуковой записи и позволяют в дальнейшем использовать его в голосовых помощниках, онлайн-синтезаторах и пр.

В перспективе получить синтезированную речь станет дешевле, чем записать диктора, и многие голосовые артисты лишатся работы, считают авторы письма.

Дикторы в письме рассказывают о фактах «кражи» голоса с помощью ИИ: «Нет ни норм, ни практики, ни понимания, как писать претензию. Заказчики ссылаются на договор, в котором есть пункты про отчуждение прав, право на переработку и право передачи третьим лицам».

Члены союза предлагают закрепить запрет на отчуждение прав исполнителей при использовании голосового синтеза и перейти на лицензионные договоры «с четко определенным сроком действия», как в сфере защиты прав на товарный знак. Также предлагается закрепить норму о том, что запись синтезированного голоса может использоваться только в конкретном проекте.

Михаил Мишустин, премьер РФ, 2 сентября 2021 года (цитата по ТАСС):

«Можно сколько угодно говорить о том, что роботы вытеснят какие-то специальности, заменят людей. Не соглашусь с этим».

ИИ-инструменты начинают активно внедряться для озвучивания аудиокниг, сообщал “Ъ” 23 января: участники рынка рассчитывают, что это удешевит и ускорит процесс их производства. «Издательствам нужна хорошая озвучка по приемлемой цене, дикторам — сохранение профессии, которой многие отдали годы»,— говорит руководитель аудиопроектов Alpina Digital Николай Боронин. У владельца или разработчика ИИ должен быть договор на использование голоса, однако от прямого пиратства никто не застрахован, признает он.

В издательской группе «Эксмо-АСТ» считают, что опасения дикторов «не в полной мере оправданны». Сервис «Яндекса» SpeechKit, с которым сотрудничает группа, заключает договоры с диктором, на основе голоса которого синтезируется речь, говорят в пресс-службе группы. Кроме того, без личного участия специалиста, чей голос отобран по специальным параметрам, невозможно добиться качества автоматического озвучивания, добавляют в группе.

Глава VS Robotics (занимается решениями на базе речевых технологий) Дмитрий Теплицкий рассказал, что в теории синтезировать речь определенного человека можно и без многочасовой записи: «У нас есть опыт создания голосов знаменитых личностей на основе записей спектаклей, отрывков из фильмов, публичных выступлений. Здесь важно, чтобы записи были как можно более чистыми и сопровождались текстовой расшифровкой». Но для создания нового голоса для TTS (text-to-speech, преобразование текста в речь) компания все же отбирает дикторов и записывает их живой голос продолжительностью от пяти часов. Гендиректор ЦРТ Дмитрий Дырмовский отмечает, что компании-лидеры в области речевых технологий уделяют внимание легитимности его применения «и в целом этике ИИ».

Голос невозможно защитить от «копирования»: если имитирование само по себе совершается без преступного умысла, то за такое использование даже ответственности не предусмотрено, говорит управляющий партнер Enterprise Legal Solutions Юрий Федюкин:

«Понять дикторов можно, но с точки зрения закона реализация их инициативы невозможна просто в силу того, что законом защищается не голос, а фонограмма, созданная с его применением».

Внесение изменений в российское законодательство, которые могли бы сделать это возможным, не имеет смысла, полагает Юрий Федюкин, поскольку обрабатывать фонограммы дикторов тогда просто будут в других странах.

Валерия Лебедева, Юрий Литвиненко

Новости компаний Все

Загрузка новости...
Загрузка новости...
Загрузка новости...
Загрузка новости...
Загрузка новости...
Загрузка новости...
Загрузка новости...
Загрузка новости...
Загрузка новости...
Загрузка новости...
Загрузка новости...