Биг дате есть куда расти
Российский рынок больших данных и ИИ может составить 520 млрд рублей
Российский рынок, объединяющий направления Big Data и ИИ, по итогам 2025 года может достигнуть 520 млрд руб. Рост стимулируют господдержка, импортозамещение и развитие облачных инфраструктур. Основными же барьерами для дальнейшего развития остаются дефицит кадров, особенно в области машинного обучения, и нежелание консервативного бизнеса инвестировать в технологии. Кроме того, бизнес опасается делиться собственными данными с рынком, что увеличивает себестоимость информации для отрасли.
Фото: Евгений Разумный, Коммерсантъ
Фото: Евгений Разумный, Коммерсантъ
“Ъ” ознакомился с совместным исследованием Ассоциации больших данных (АБД; объединяет «Сбер», «Яндекс», VK и др.), консалтинговой компании Б1 и TAdviser, в котором говорится, что российский рынок Big Data и искусственного интеллекта (ИИ) по итогам 2025 года может составить 520 млрд руб. При этом в 2024 году объем рынка оценивался в 433 млрд руб., а среднегодовой темп роста рынка больших данных в ближайшие пять лет может составить 20%, добавляют в АБД. Рынки оцениваются вместе, так как Big Data — «топливо» для ИИ и технологии связаны, объясняют авторы исследования.
Причина таких темпов роста рынка ИИ и Big Data в России заключается в господдержке, сказано в исследовании.
Например, федеральный проект «Искусственный интеллект» предусматривает бюджетное финансирование направления в 15,7 млрд руб. на период 2024–2026 годов. Также на рост может влиять импортозамещение, которое стимулирует создание отечественных платформ.
Развитие ИИ в России обеспечивается как за счет клиентских сервисов, так и благодаря внедрению в бизнес-процессы, говорят в пресс-службе «МегаФона». При этом в пресс-службе ВТБ добавляют, что причины роста могут быть связаны еще и с появлением крупных облачных инфраструктур и платформ, создающих условия для масштабного применения ИИ. В исследовании также сказано, что облачные технологии становятся «ядром технологического ландшафта» рынка Big Data: к 2026–2027 годам 75% глобальных организаций будут использовать их как базовую платформу для работы с данными. В «Вымпелкоме» связывают динамику в первую очередь с господдержкой.
Однако сдерживающими факторами развития направлений в России в ближайшие два года будут инфраструктурные, кадровые и бизнес-экосистемные барьеры, считает директор по искусственному интеллекту и цифровым продуктам «Вымпелкома» Константин Романов: «Мы наблюдаем нехватку квалифицированных специалистов, особенно в области машинного обучения и Data Science, конкуренция за профильных специалистов усиливается между крупными и региональными компаниями». Он добавляет, что отсутствие «зрелых» бизнес-кейсов по некоторым технологиям удерживает «консервативные» предприятия от инвестиций: многие руководители не до конца понимают возможности ИИ и предпочитают традиционные решения. В «Яндексе», «ВКонтакте», МТС, «Cбере» и Т-Банке не ответили “Ъ”.
40 процентов
российских IT-компаний используют генеративный ИИ в 2025 году, по данным «Сбера».
Характерной чертой российского рынка данных является модель работы, когда компании в основном не продают исходные данные напрямую, а пользуются серверами с такими данными. Это обусловлено юридическими ограничениями, включая банковскую тайну, тайну связи и закон о персональных данных, писал “Ъ”. В результате основным товаром стали агрегированные аналитические отчеты, сформированные на основе обезличенных сведений, а также готовые продукты, созданные с применением технологий больших данных, при условии наличия согласия клиентов на обработку их информации (см. “Ъ” от 24 сентября 2024 года).
Такая модель работы напрямую влияет на стоимость данных, которая остается высокой из-за требований законодательства и таких факторов, как хранение и обработка персональных данных внутри страны, обязательная анонимизация, риск крупных штрафов, отмечает партнер инвесткомпании Kama Flow Кирилл Тишин. Он говорит, что это увеличивает себестоимость для легальных поставщиков. «При этом все чаще компании покупают не Big Data в привычном смысле, а обезличенные дата-сеты, аналитические модели и API-доступ к данным, то есть более сложные, но законные продукты на базе данных»,— заключает Кирилл Тишин.