Сага о Big Data
Использование технологий Big Data (больших данных) в бизнес-процессах стало сегодня неотъемлемой частью цифровизации не только отдельных корпораций или отраслей, но и экономики в целом. По данным IDC, к 2020 году мировой объем рынка больших данных превысит $200 млрд, и нет ничего удивительного в том, что власти обратили внимание на такую динамично развивающуюся индустрию. У России есть неплохие шансы стать одним из мировых центров Big Data — понимая это, президент Владимир Путин поручил до конца года утвердить генеральную схему развития сетей связи и инфраструктуры хранения и обработки данных. Впрочем, насколько отрасль нуждается в регулировании и каковы шансы нашей страны стать глобальным лидером на этом рынке — вопрос все еще открытый.
Фото: Ростелеком
Big Data идет на выручку
Задача Big Data — анализировать доступные данные, вычислять тренды и корреляции между, казалось бы, не связанными между собой событиями. По консолидированному прогнозу аналитиков, рынок больших данных в России к 2024 году достигнет как минимум 300 млрд руб., сейчас, по разным оценкам, он составляет от 10 до 30 млрд руб. Общий экономический эффект и рост выручки всех индустрий в России за счет использования результатов обработки Big Data в среднесрочной перспективе составит от 1,5 до 3% ВВП, подсчитали в Ассоциации участников рынка больших данных (АУРБД).
Сейчас в России наиболее активными участниками рынка больших данных являются компании телекомсектора, интернет-компании, банки и ритейл. Наибольший вклад в бизнес пока вносит применение аналитики с использованием больших данных, а не продажа услуг на основе Big Data в чистом виде. Так, удаленная цифровая идентификация, проверки, предсказательные модели на основе больших данных — все это снижает издержки, связанные с мошенничеством, на 15–20% в зависимости от используемых технологий, отмечает гендиректор IDX Светлана Белова.
Аналитика больших данных способствует развитию конкуренции, а это один из наиболее мощных драйверов экономики, отмечает глава дирекции аналитических и индустриальных решений «SAS Россия/СНГ» Александр Ефимов. По его словам, цифровизация позволит по-новому взглянуть на те стороны экономики страны, которые до этого оставались в тени, например на рынок аренды: «Механизмы нелегальной сдачи квартир планируется отслеживать с помощью больших данных и анализа крупных интернет-ресурсов, после чего обязывать арендодателей уплачивать законный налог». Сегодня государство — уже крупнейший владелец данных о своих гражданах и организациях, напоминает президент АУРБД и член совета директоров «Мегафона» Анна Серебряникова: «Однако потенциал коммерческого использования обезличенных данных, которые можно получить из государственных информационных систем и других источников, пока не раскрыт».
Данные в беззаконье
Вместе со стремительным развитием технологий сбора и обработки Big Data возникает вопрос о защите прав и свобод субъектов персональных данных, то есть простых интернет-пользователей, клиентов банков и абонентов сотовых операторов. Один из наиболее ярких примеров связан со скорингом. На основании вольного толкования информации из соцсетей человеку могут отказать в открытии счета или не дать кредит, отмечает Светлана Белова.
Сейчас в России существуют понятия разных типов данных: это и персональные данные, и так называемые открытые данные, и данные, доступ к которым ограничен, в том числе данные, содержащие различные виды тайн. Но четкого понимания, что из этого может считаться Big Data, что — свободно собираться и обрабатываться, а что требует особой защиты, нет, отмечает директор по правовым инициативам Фонда развития интернет-инициатив (ФРИИ) Александра Орехович. В России назрела необходимость регулирования этой сферы, в том числе Big Data, убеждена она.
С точки зрения регулирования большее беспокойство вызывает использование больших данных в тех аспектах, где они пересекаются с данными персональными, говорит руководитель технологической практики в риск-консалтинге КПМГ в России и СНГ Николай Легкодимов. У Google был проект, связанный с ранним обнаружением эпидемий, приводит пример он: «По нему предлагалось анализировать утреннюю переписку людей с родственниками или коллегами и выявлять жалобы на самочувствие. Такие информационные сигналы появляются гораздо раньше, чем люди приходят в поликлиники, и это критически важно для раннего реагирования и предотвращения распространения заболевания». Это пример того, как технология может реально сохранить человеческие жизни, но из-за нарушения прав человека в области персональных данных она не используется, говорит господин Легкодимов.
Регулировать нельзя оставить
Считая саморегулирование больших данных недостаточным, власти настаивают на регулировании этой сферы. Законопроект, закрепляющий определение больших пользовательских данных, их оператора и вводящий правила их обработки, был внесен в Госдуму еще в октябре 2018 года депутатом от «Единой России» Михаилом Романовым. Однако отрасль раскритиковала документ: по мнению экспертов, это увеличит нагрузку на бизнес и может усугубить технологическое отставание России. В результате комитет Госдумы по информполитике решил вернуть законопроект его автору.
Помимо этого, в госпрограмме «Цифровая экономика» предусмотрена разработка законопроекта, устанавливающего правила и порядок доступа к общедоступным данным. Минэкономики планировало внести документ в правительство до конца 2018 года, но он так и не был подготовлен. Власти рассматривали три концепции регулирования. Первая закрепляла за площадкой, собирающей данные, права на управление размещенными на ней данными. Модель поддерживали крупные игроки. Вторая концепция предусматривала свободную обработку общедоступных данных, размещенных на платформах, без согласия их субъектов. Это было бы выгодно стартапам, которые зарабатывают на сборе данных и оказании услуг по их анализу.
Третий вариант не предусматривал введения дополнительного регулирования, а ограничивался введением дополнительных соглашений между крупными интернет-площадками и третьими лицами. Но власти до сих пор однозначно не определились в выборе модели. Сейчас концепцию управления данными готовит центр компетенций «Сколково», а предложения к ней были подготовлены АНО «Цифровая экономика».
Бизнес борется за Data
Параллельно с инициативами в части регулирования выступают и другие бизнес-объединения. Так, в январе ФРИИ подготовил законопроект, вводящий в законодательство термин «персонализированные данные» и предлагающий обеспечить их свободное обращение на рынке. Иными словами, граждане смогут предлагать бизнесу свои данные с определенной целью и сроками за вознаграждение в различных формах и тем самым зарабатывать до 60 тыс. руб. в год. Пользователь сам должен распоряжаться своими данными, решать, кому их передавать, согласна Светлана Белова. «Для этого надо предоставить гражданину удобный интерфейс для доступа к своим данным, хранящимся в ГИСах и у бизнеса, как это уже реализовано у „ВКонтакте“, Facebook, Telegram и других платформ»,— считает она. «Все, что может привести к возможности нарушения прав и свобод владельцев персональных данных, должно быть четко урегулировано, в том числе их оборот, а все, что касается собственно данных, которые не могут содержать информацию ограниченного доступа, в том числе персональных данных, очевидно, может быть отдано на откуп отрасли»,— полагает Александра Орехович.
Созданная в октябре прошлого года АУРБД (объединяет «Ростелеком», «Яндекс», Mail.ru Group, Сбербанк, Газпромбанк, Тинькофф-банк, «Мегафон», oneFactor и Qiwi), напротив, выступает за саморегулирование в сфере оборота Big Data. «Мы совместно с Институтом развития интернета готовим кодекс использования данных, который станет обязательным для всех участников организации»,— напомнила Анна Серебряникова. По ее словам, он должен стать актом отраслевого саморегулирования, закрепляющим не предусмотренные законодательством правила работы с массивами данных.
По оценке Николая Легкодимова, основная опасность в регулировании этой сферы заключается как в расширительном толковании того, что такое большие данные по отношению к человеку, так и в возможности выводить приватную информацию о человеке исходя из данных, которые сами по себе персональными не являются. Объемы обработки Big Data и современные механизмы позволяют, например, на основе знаний о районе проживания и истории пары покупок идентифицировать человека с точностью до ФИО, отмечает он: «В США были случаи, когда использование таких технологий приводило к поимке преступников». В то же время, если говорить о России, в силу модели взаимодействия гражданина и государства наши власти всегда будут стремиться к тому, чтобы быть владельцем и контролером таких данных, считает он: «Это неудивительно, ведь, например, аналитикой, которую дают телекомкомпании, можно пользоваться для управления электоратом». Именно в таком скрытом влиянии на предвыборный процесс обвиняют Cambridge Analytica и сторонников «Брексита», напоминает эксперт.