Зачем Big Data объединяться, и что такое Data Fusion

Какие возможности открывает перед бизнесом новый подход к обработке и аналитике данных

Глава департамента анализа данных и моделирования ВТБ Максим Коновалихин — о том, можно ли увеличить большие данные и зачем

Максим Коновалихин, глава департамента анализа данных и моделирования ВТБ

Максим Коновалихин, глава департамента анализа данных и моделирования ВТБ

Фото: Предоставлено пресс-службой группы "ВТБ"

Максим Коновалихин, глава департамента анализа данных и моделирования ВТБ

Фото: Предоставлено пресс-службой группы "ВТБ"

Термин «Big Data» постоянно звучит из самых разных источников. Про важность анализа и работы с большими данными говорят все вокруг: от совсем небольших фирм до транснациональных корпораций, часто данные сравнивают с нефтью и светом. Компании утверждают, что работа с Big Data — это минимум, без которого невозможно создавать новые продукты и делать сервисы более комфортными. При этом клиенты многих компаний продолжают получать раздражающие рассылки и звонки в неудобное время. В чем же проблема?

Ответ простой и сложный одновременно. Простой, потому что решение кажется очевидным — для формирования не надоедливой, ненужной рекламы, а по-настоящему полезных клиентам предложений и сервисов нужно объединять обезличенные данные из разных источников, накладывать их друг на друга и работать с этими Big Data в квадрате, кубе и других степенях с помощью различных технологий. Сложный, потому что это очевидное решение очень непросто реализовать на практике: мало кто хочет делиться данными с конкурентами, существуют ограничения на обмен и передачу данных и т. д. Кроме того, встают вопросы: как сделать объединение данных максимально безопасным? Какие технологии для работы с объединенными данными выбрать? Специалисты ВТБ и партнеров банка с разных сторон смотрели на возможности решения этих вопросов и выбрали в качестве приоритетного направления работы с массивами Big Data подход Data Fusion.

В чем суть

Концепция Data Fusion изначально появилась в аэрокосмической отрасли и робототехнике. Под Data Fusion понимались алгоритмы, которые объединяли и обрабатывали данные от различных датчиков для автоматического принятия наиболее эффективного решения. Позже понятие расширилось и трансформировалось. Теперь мы понимаем под Data Fusion не только одновременное использование разных и косвенно связанных массивов Big Data, но и применение для их обработки сразу нескольких технологий. Например, машинное обучение и георазметка данных или графовая аналитика и машинное обучение.

Очень важно, что подход Data Fusion позволяет не просто сопоставлять данные, но и использовать разные алгоритмы анонимизации для их защиты, так как безопасность данных сегодня один из ключевых вопросов, вызовов.

Где кроме банков

Удивительно, но один из неочевидных примеров применения Data Fusion — атомная электростанция. Генерация, сбор и обработка данных о событиях и мгновенное принятие решений на основе алгоритмов машинного обучения и искусственного интеллекта — яркая иллюстрация управления процессом на основе данных из разных источников. Современное навигационное ПО в наших любимых смартфонах также решает логистическую задачу с применением Data Fusion. Алгоритмы в режиме онлайн обрабатывают объединенные данные, которые собираются с различных устройств и преобразуются в динамические геоаналитические слои.

Практически во всех отраслях бизнеса сегодня необходимо формирование таргетированной рекламы. Компании из совершенно различных сфер давно поняли, что без объединения данных они не смогут выиграть в конкурентной гонке по этому направлению, потому подход Data Fusion уже активно используют лидеры рынка в ритейле, банковском, страховом, рекламном, логистическом бизнесе.

Как работает на практике

ВТБ и «Ростелеком» создали совместное предприятие Platforma («Платформа больших данных»), которое активно применяет в своей работе подход Data Fusion. Компания создает инфраструктуру и алгоритмы для безопасного объединения данных из разных отраслей. Уже сегодня на основе больших данных Platforma формирует таргетированные аудитории для рекламного рынка, представляет в формате B2B сервисы по выделению сегментов физических или юридических лиц, склонных к какому-либо продукту.

Применение Data Fusion является важной частью цифровой трансформации многих организаций, в том числе ВТБ. На текущий момент в рамках трансформации мы уже смогли объединить данные разных направлений внутри банка и массивов Big Data партнеров. Обработка данных производится алгоритмами машинного обучения с помощью созданных геоаналитической платформы, графовой платформы, стриминговой платформы. Экономический эффект от этого уже составляет миллиарды рублей.

Загрузка новости...
Загрузка новости...
Загрузка новости...
Загрузка новости...
Загрузка новости...
Загрузка новости...
Загрузка новости...
Загрузка новости...
Загрузка новости...
Загрузка новости...
Загрузка новости...