Участники рынка просят Минцифры снять барьеры для обмена информацией, распространить модель открытых API на разные отрасли экономики и оформить наборы данных как объекты имущественных прав. Существующие ограничения, считают они, тормозят развитие ИИ в России. Аналитики проблемы с оборотом данных в РФ подтверждают, однако считают, что реализация предложений на практике может столкнуться с сопротивлением крупного бизнеса.

“Ъ” ознакомился с письмом «Ассоциации больших данных» (АБД; объединяет «Сбер», «Яндекс», VK и др.), отправленным в Минцифры 19 января. В нем АБД перечисляет проблемы действующего регулирования сферы искусственного интеллекта (ИИ) и выдвигает свои предложения по его донастройке. Ассоциация пишет, что необходимо конкретизировать порядок отнесения информации к персональным данным (ПД) и сведениям, которые составляют, например, банковскую тайну, если эти данные были обезличены или зашифрованы без возможности восстановления.

«Без этого формально никакая передача данных невозможна и остается в серой зоне, что существенно тормозит развитие аналитики данных и ИИ»,— объясняют в пресс-службе АБД. В соответствии с действующим регулированием в области ПД и конфиденциальной информации, передача данных из контура оператора запрещена, объединение данных, собранных в разных целях, запрещено, обезличивание (даже необратимое) без согласия субъекта запрещено, добавляют в пресс-службе.

Кроме того, ассоциация пишет, что из-за отсутствия единых стандартов открытых API по модели Open Data в РФ формируется «асимметрия» информации, не позволяющая обмениваться данными разным участникам рынка, например телеком-операторам, маркетплейсам и банкам. «Огромные массивы данных заперты внутри экосистем крупного бизнеса. Такой дисбаланс и отсутствие кросс-отраслевого обмена данными ограничивает циркуляцию, доступность и разнообразие данных, необходимых для обучения моделей ИИ, сдерживает развитие конкуренции, улучшение клиентского сервиса и препятствует появлению новых видов инновационных продуктов, услуг и сервисов на основе данных»,— пишут авторы обращения. Отдельно предлагается оформить наборы данных (датасеты) как самостоятельный объект имущественных прав и внести соответствующие изменения в законодательство: отсутствие рыночного оборота набора данных как объекта имущественных прав, пишут в АБД, не позволяет реализовать их потенциал в качестве ценного актива для экономики.

Также ассоциация указывает, что сейчас нет «прозрачной и предсказуемой модели» платы за госданные, что «ограничивает их оптимальное распределение и использование». Для этого предлагается предоставлять базовый доступ к госданным бесплатно, либо тарифицировать по принципу «предельных затрат» — то есть без наценки сверх стоимости обеспечения доступа. «Минцифры получило обращения представителей отрасли, в том числе АБД, по вопросам регулирования искусственного интеллекта. Сейчас эти инициативы оцениваются с точки зрения целесообразности»,–– сказали “Ъ” в министерстве.

Для обучения ИИ на рынке действительно не хватает данных, подтверждает глава направления по взаимодействию с регуляторами Swordfish Security Альбина Аскерова. По словам независимого эксперта по ИИ Алексея Лерона, без снятия барьеров к данным генеративный ИИ в России упрется не в качество алгоритмов, а в «сырьевую базу».

Другие опрошенные эксперты обращают внимание на существующие институциональные и экономические ограничения. Партнер практики технологического консультирования ДРТ Тимофей Хорошев считает, что реализовать инициативы такого масштаба быстро будет сложно: каждый кейс требует отдельного анализа и сопровождения, а экспериментальные режимы в текущем формате часто не успевают за темпом развития технологий. Руководитель департамента технической поддержки Hybrid Алексей Штейгер видит в идее широкого обмена данными потенциал снижения операционных затрат и устранения дублирующих процессов, но прогнозирует сопротивление крупного бизнеса, прежде всего банков и маркетплейсов, для которых данные — это товар и источник конкурентного преимущества. По его мнению, готовность отраслей к внедрению открытых API будет сильно различаться, а экономический эффект окажется неоднородным.

Филипп Крупанин, Алексей Жабин