Буквально за год несколько значительных событий в бизнесе, политике и других сферах человеческой жизни продемонстрировали, насколько важным и полезным может быть анализ Больших Данных.
Например, Google продемонстрировала впечатляющую оперативность в обнаружении эпидемий гриппа в США. Еще до того, как профильное ведомство (CDC) смогло получить какие-либо отчеты из больниц и поликлиник, в поисковом гиганте уже могли точно указать очаги эпидемий, обнаружив их по всплеску поисковых запросов, связанных с противопростудными лекарствами. А американское подразделение T-Mobile US смогло уменьшить отток абонентов на 80%, благодаря проводимому практически в реальном времени анализу эффективности маркетинговых программ на примере 21 млн. абонентов и значительному ускорению тестирования не запущенных программ на поведенческом профиле этой выборки. Хотя в «первой волне» потребителей Больших Данных доминируют финансовые, сырьевые и торговые организации (последние по оценкам McKinsey Global Institute могут повысить операционную маржу более чем на 60%), потенциал этой сферы высок для любой индустрии. По опросу, проведенному корпорацией EMC, 47% руководителей считают, что применение Больших Данных значительно изменит конкурентный ландшафт, создав новых лидеров и аутсайдеров на рынке – в число первых, конечно, войдут те, кто вовремя интегрирует Большие Данные и предиктивную аналитику в свои бизнес-процессы. Основным останавливающим фактором в этом процессе является неготовность компаний – в них нет исследователей данных, и оценить перспективы, заняться грамотной интеграцией аналитики в бизнес просто некому.
По данным Ventana Research, около половины организаций в мире не имеют квалифицированных сотрудников для того, чтобы внедрить необходимую аналитику. Поэтому для получения стратегического преимущества в бизнесе, компаниям потребуется преодолеть этот дефицит. Проблема усугубляется тем, что даже в лучших академических учреждениях учебные курсы для исследователей данных открылись лишь в прошлом году, поэтому на сегодня почти все исследователи – это практики, выросшие из математиков или специалистов по естественным наукам. И их немного. Пока дефицит специалистов покрывается методами аутсорсинга – практически каждый исследователь очень прилично зарабатывает, одновременно консультируя несколько компаний. И даже крупный бизнес, испытывающий потребность в полной занятости аналитиков, как правило не может найти достаточно людей – и зачастую штатные исследователи данных прежде всего заняты надзором за деятельностью нанятой команды подрядчиков. Впрочем, даже этот уровень все еще недоступен для многих крупных компаний, которые лишены подходящего персонала вообще. Поэтому поставщики решений для Больших Данных, такие как ЕМС, вынуждены заниматься деятельностью по обучению. Так, в EMC трудится команда из 25 исследователей данных, которые помогают потенциальным клиентам исследовать имеющиеся в компании наборы данных и понять, какую бизнес-выгоду может принести внедрение аналитики на их основе.
Разумеется, высокие зарплаты исследователей данных – на сегодня это около 100 тыс. евро в год – в конечном счете привлекут людей, простимулируют их получить нужное образование, но на это уйдут годы. Чтобы процесс шел более эффективно, IT-индустрия должна вносить свой вклад, создавая тренинговые программы, помогая людям с математическим и статистическим образованием получить необходимую для превращения в исследователя данных дополнительную подготовку, а также поддерживать общественные инициативы по популяризации математики в школах и университетах.