Искусственный интеллект в действии. Машины уже умеют давать точные прогнозы по количеству аварий, районам, где могут быть совершены преступления, предсказывать победу той или иной сборной по футболу. И это только начало. О том, что скрывается за термином Big Dаta и как российские компании используют «большие данные» — в материале Наталии Боевой.
Фото: Никита Инфантьев, Коммерсантъ / купить фото
Термин Big Dаta появился меньше 10 лет назад и прочно укрепился в деловой прессе. Речь об объемах информации, измеряемых как минимум в петабайтах — это 1 млн ГБ. IT-компании научились не только хранить такие массивы данных, но и анализировать их. Результаты феноменальные. Говорят, что сборная Германии по футболу в 2014 году стала чемпионом мира в том числе за счет внедрения такого подхода. Анализировались действия каждого игрока и команды в целом — от скорости футболиста до взаимодействия с партнерами. В результате тренерский штаб имел вполне четкие рекомендации, как выстраивать игру.
Но это, скорее, единичный пример. Чаще такие массивы информации используют не в спорте, а в бизнесе. Рынок Big Dаta состоит из трех сегментов: компаний, которые предоставляют данные — это могут быть сотовые операторы, платежные системы, интернет-магазины; тех, кто их хранит — чаще всего это мировые лидеры IT-индустрии; и, наконец, третий сектор — компании, которые пишут алгоритмы для анализа таких объемов. По оценкам экспертов из исследовательской компании IDC, размер российского рынка в 2014 году составил $340 млн. Заказчики самые разные — от представителей сферы услуг до реального производства. Банки, например, оценивают риск невозврата кредита конкретным клиентом, ритейлеры знают наперед, что приобретет их покупатель, а металлурги оптимизируют процесс выплавки стали, рассказал гендиректор компании «АлгоМост» Михаил Левиев.
«Чтобы получить конечный продукт, сталь какой-то определенной марки, необходимо понять, какое количество чего нам в данный момент времени надо использовать, чтобы получить результат. Большой пример есть еще у итальянских железных дорог, которые перешли от модели обслуживания и ремонта по регламенту к предиктивной модели обслуживания — "эта деталь требует замены вот так". Это позволило получить какую-то фантастическую экономику — более $200 млн в первый же год», — подчеркнул Левиев.
Анализ нужной информации обходится заказчику в сумму от нескольких сотен тысяч рублей до нескольких сотен тысяч долларов. Рынок молодой, и у новых стартапов неплохие шансы на успех. О финансовой стороне вопроса рассказал один из основателей компании Data Management Platform Валерий Кашин.
«На момент принятия нами решения о том, что нужно привезти это в Россию, вложили по старому курсу сумму, колеблющуюся между $500 тыс. и $1 млн, именно в технологиях. Сошлись на метрике оценки западных сделок, которые проводились, например, в Штатах. На текущий момент стоимость компании я оцениваю в районе 500 млн руб.», — отметил Кашин.
Родом все эти технологии — из российской математической школы. Ведущие представители сферы «больших данных» — люди с русскими фамилиями. Кстати, «Яндекс» недавно опубликовал результаты необычного исследования: в компании выбрали несколько народных примет относительно погоды и посчитали, как часто они срабатывали. Выяснилось, что за 36 лет большинство из них не оправдалось. То есть приметы вообще лучше понимать наоборот.