Большие данные как повод для партнерства
Как обеспечивается безопасность в совместной работе с Big Data
Объем данных растет с каждым годом: к 2025 году в мире будет насчитываться 175 ЗБ данных, прогнозировали в IDC в 2019 году. Вместе с этим растет и ее ценность: анализ Big Data позволяет компаниям выстраивать стратегии работы, оптимизировать распределение бюджетов и усилий. В тренде сегодня совместная работа компаний с данными, то есть объединение клиентских баз для анализа рынка и создания партнерств. Однако необходимость защиты персональных данных, а также нежелание делиться информацией с конкурентами становятся для подобных партнерств настоящим препятствием. Так на рынке сформировался запрос на технологии конфиденциальных вычислений, которые облегчают совместную работу с Big Data. В России эти технологии используют как отдельные компании, так и платформы обмена данными.
Фото: Петр Кассин, Коммерсантъ
Большие заработки на больших данных
Работа с большими данными с каждым годом сулит бизнесу все большие заработки: в 2021 году объем мирового рынка Big Data и бизнес-аналитики составил $215,7 млрд, тогда как в 2018-м он оценивался в $168,8 млрд, следует из оценок Statista. По данным MarketsandMarkets, глобальные расходы компаний и госучреждений на работу с инструментами Big Data по итогам 2021 года достигли $162,6 млрд. В России же, по оценке Ассоциации больших данных, рынок Big Data составлял от 10 млрд до 30 млрд руб. в 2019 году с перспективой роста до 300 млрд руб. к 2024 году.
Однако одним из камней преткновения для бизнеса на пути использования больших данных является законодательство по защите персональных данных. В Европе в рамках GDPR (General Data Protection Regulation) действуют оборотные штрафы за утечку информации, в результате чего ответственность компании, допустившей утечку, может достигать миллионов евро. В России обсуждается возможность введения аналогичной системы: Минцифры согласовало законопроект, предполагающий введение штрафа за утечку персональных данных в размере от 1% до 3% от годовой выручки компании (см. “Ъ” от 30 мая).
«Помимо работы с развивающимся международным законодательством о конфиденциальности и защите данных IТ-директора должны избегать любой потери доверия клиентов в результате инцидентов, связанных с конфиденциальностью»,— подчеркивали аналитики Gartner в отчете, определяющем тенденции в сфере технологий в 2022 году. Одним из стратегически значимых трендов, по мнению Gartner, является работа с конфиденциальными вычислениями. Аналитики ожидают, что к 2025 году 60% крупных организаций будут применять вычисления, повышающие конфиденциальность.
Что такое конфиденциальные вычисления
Конфиденциальные вычисления — это технология, которая облегчает совместную работу с Big Data и позволяет компаниям обмениваться информацией, не открывая прямого доступа к цифрам. Например, компании хотят выяснить объем общего рынка, но не хотят раскрывать друг другу свою выручку. В таком случае им потребуется третий участник, так как в паре любой результат будет обратимым. Такую возможность дает технология конфиденциальных вычислений. Она представляет собой прямую связь между приложением и процессором, которые образуют доверенную систему, недоступную для других программ и систем.
Большую ценность такие вычисления создают, к примеру, в сфере здравоохранения, которая оперирует наиболее чувствительными данными. Например, в начале пандемии IT-компании разрабатывали экспресс-системы диагностики COVID-19 на основе искусственного интеллекта, однако медицинские организации не имели права передавать сторонним компаниям снимки пациентов, необходимые для машинного анализа. Эту проблему можно было бы решить с помощью технологии конфиденциальных вычислений Intel Software Guard Extensions (Intel SGX), которая появилась в 2020 году и является наиболее зрелой на данный момент.
Развитие технологий конфиденциальных вычислений осложняет то, что нейронные сети требуют использования очень мощных серверов, а для построения модели необходимо большое количество времени. «Сложность в том, что построение моделей — интерактивный процесс. Часто приходится менять данные или исходные параметры анализа,— объясняет директор по анализу данных и моделированию Platforma Сергей Голицын.— А если модель обучается неделю, то даже простейший анализ может растянуться на месяцы». Однако, по его словам, уже есть стартапы, которые за три года существования этой технологии смогли оптимизировать ее до уровня, при котором модель обучается за один день.
Конфиденциальные вычисления реализуются при помощи процессоров, которые поддерживают этот протокол защиты, но из-за ограничения импорта в РФ подобные процессоры ограниченно доступны, отмечает эксперт по информационной безопасности Axenix Евгений Качуров. По его мнению, чтобы исправить ситуацию, необходимо перейти на отечественные процессоры: «На фоне широкого распространения российских процессоров производители смогут инвестировать в развитие технологий, что приведет к распространению технологии в РФ».
Российский опыт
Конфиденциальные вычисления, по сути, новейшая технология для российского рынка: она появилась в фокусе отечественных интеграторов и производителей аппаратного и программного обеспечения в 2020–2021 годах, рассказали в Газпромбанке. Такие технологии важны там, где компании совместно используют ресурсы, например облачные: согласно опросу, проведенному Axenix (ex-Accenture) в 2021 году, более 41% российских компаний при использовании облачных технологий видят риски с точки зрения информационной безопасности, говорит господин Качуров.
Применение технологии позволило бы предотвратить масштабные утечки персональных данных, согласен ведущий инженер CorpSoft24 Михаил Сергеев. Однако, по его мнению, для небольших компаний ее работа «не очень рентабельна, так как расходы на внедрение и использование в разы больше, чем финансовые последствия от утечек».
В России такие технологии более востребованы в сферах с повышенными регуляторными требованиями или строгими требованиями к конфиденциальности данных (финансовый сектор, ритейл, IТ), рассуждает Евгений Качуров. Так, первую в России доверенную среду совместной работы с данными запустили в 2019 году ритейлер «Магнит» и компания по управлению цифровыми лицензиями Aggregion. Технология используется для управления цифровой рекламой: информация о клиентах «Магнита» проходит обработку с помощью Intel SGX, после чего персональные данные обезличиваются и с ними может работать софт рекламных групп—партнеров ритейлера, например сегментировать аудиторию по предпочтениям в выборе товаров. В результате «Магнит» на 20–30% сократил затраты, связанные с размещением рекламы в цифровых каналах. Ритейлер продолжает использовать технологию и работает над возможностью ее использования другими участниками проекта, рассказали в компании.
«Одной из самых востребованных и перспективных на рынке» считают технологию конфиденциальных вычислений и в ВТБ: в банке сейчас идет пилотный проект с ней. Однако существующие на рынке решения «не полностью отвечают» требованиям банка в части универсальности, скорости вычислений и обеспечения технологического суверенитета, поэтому ВТБ сейчас разрабатывает собственное решение.
Альфа-банк уже давно пробует конфиденциальные вычисления, для реализации которых нужны «весьма продвинутые технологии, а также надежные партнеры». «У банка есть и то и другое, что позволяет уже сейчас получать первые значимые результаты, подтверждающие высокий потенциал этого подхода»,— говорит руководитель департамента продвинутой аналитики Альфа-банка Алексей Каширин. По его мнению, для компаний, развивающих системы управления и процессы принятия решений на основе продвинутой аналитики, конфиденциальные вычисления — это «не просто перспективная опция, а практически безальтернативный путь».
В Газпромбанке для комплексного обеспечения информбезопасности автоматизированных систем технологию конфиденциальных вычислений пока не применяли, но не исключают такой возможности в будущих проектах, рассказали в пресс-службе.
Кроме финансового сектора к вычислениям такого рода пристально присматривается и телеком. В 2021 году «Билайн Бизнес» (структурное подразделение ПАО «Вымпелком») начал создание децентрализованной платформы для обработки клиентских данных, которая позволит повысить точность подбора аудиторий для маркетинговых активностей и масштабировать текущий функционал. Предполагается, что на платформе будут размещаться данные крупнейших организаций, в том числе ритейлеров и фармкомпаний, которые участники смогут монетизировать, предоставляя доступ друг другу и создавая новые партнерства. В целом мэтчинг с партнерами — «следующий шаг для развития рынка работы с большими данными, так как крупные игроки уже научились работать с данными и получать от них выгоду»,— полагает генеральный директор Platforma Алексей Каштанов.
Уберизация данных
Сегодня компаниям уже недостаточно анализировать только собственные большие данные. Чтобы получать полную картину, бизнесу важно комбинировать разные источники, в том числе базы данных партнеров и конкурентов. По оценке McKinsey, доля компаний, вступающих в партнерства на основе совместного доступа к информации, еще в 2017–2019 годах выросла вдвое, до 40%.
Востребованность партнерств в работе с данными привела к появлению новой бизнес-модели — уберизации обмена данными. При такой модели компании делятся ими не друг с другом, а с третьей стороной — платформой для обмена данными, которая обеспечивает безопасные условия и инфраструктуру. Например, базу для подобной платформы разработали компании Platforma и HFLabs. Технологию впервые протестировали в июле текущего года один из крупнейших в стране банков и ведущий телеком-оператор: компании объединили имеющиеся у них сведения, состоящие более чем из 250 млн записей, и выявили количество клиентов, которые пользуются услугами обеих организаций.
В перспективе платформа сможет стать банком данных, где партнеры хранят свои данные без доступа со стороны других участников, но с возможностью работать с базами, проводить анализ и создавать совместные сервисы и бизнес-продукты, рассчитывают в компании.