Крупнейшие мировые корпорации столкнулись с неожиданно быстрым, лавинообразным ростом объема хранимой информации. Это создает принципиально новые условия работы для многих сфер бизнеса и значительные трудности, но может стать конкурентным преимуществом компании. О том, как строить работу в эпоху данных размышляет президент EMC по глобальным продажам и работе с клиентами Билл Сканнелл.
Квантовый скачок – вот что произошло в первом десятилетии XXI века с хранением информации во всем мире. В прошлом году по отчету IDC объем хранимой информации в мире превысил 2800 экзабайт (миллиардов гигабайт), что в 20 раз больше, чем в 2005 году. К 2020 году ожидается рост еще в 15 раз. Самое удивительное и сложное – этот скачок не был никем спрогнозирован, что ставит перед компаниями, вынужденным работать с информацией, многочисленные сложные задачи.
Кроме непосредственного хранения данных (что уже весьма сложно при таких объемах), информацию нужно защищать. Требуется обеспечивать резервное копирование. В ряде случаев ненужную информацию нужно удалять согласно определенным процедурам – это регулируется, например, законодательством о личных данных.
Но самое сложное и в то же время перспективное – обработка этих гор информации. По данным IDC, из всего хранимого массива данных обработано (классифицировано, снабжено атрибутами, сделано доступным для поиска) всего около 1%, хотя пользу можно извлечь примерно из 23% данных. И даже качество обработки этого 1% зачастую не соответствует современным требованиям. В частности, типичные технологии «складирования» данных, как правило, делают запросы к массиву информации двухнедельной или даже двухмесячной давности. Если хранилище данных используется для принятия управленческих решений, то это похоже на управление автомобилем, у которого заклеено ветровое стекло и есть лишь зеркала заднего обзора.
Решение описанных задач должно быть таким же комплексным и системным, как сама проблема. Именно разработчики систем хранения и обработки данных тратят значительные средства на разработки и даже приобретение перспективных компаний, имеющих полезные навыки в нужной области. Это создает, в частности, для EMC огромные возможности развития.
В сфере хранения данных основными ответами на требования времени становятся переход на более быстрые способы хранения и «интеллектуализация» хранилищ. Мы делаем так, чтобы клиенту нужно было хранить меньше данных. Технологии компрессии, дедупликации (отказ от многократного хранения одинаковых файлов) позволяют снизить стоимость хранения мегабайта данных. Много внимания приходится уделять и приложениям для управления хранилищами как таковыми – в условиях изобилия данных эффективное управление самой системой хранения также значительно снижает издержки клиента. Что касается скорости, то аналитика реального времени требует существенно более быстрого доступа к полному массиву данных, поэтому новые системы хранения, целиком основанные на флеш-памяти, становятся все более востребованными – они позволяют ускориться в сотни тысяч раз по сравнению с обычными винчестерами.
Аналитика в реальном времени, система предсказаний, основанная на Больших Данных, возможность извлечь прибыль из хранимой информации – вот принципиально новое направление, которое будет бурно развиваться в обозримом десятилетии и, возможно, сильно изменит позиции компаний во многих сферах бизнеса, сделав лидеров аутсайдерами и наоборот. Аналитика ценна там, где требуется делать выводы и оперативно предлагать что-то клиенту на основе его предпочтений. Например, когда покупатель идет по супермаркету, система может «вспомнить» его покупки, проанализировать их, предположить, что сегодня клиенту нужно купить кофе и, когда он проходит мимо полок с кофе, проинформирует его, например, через смартфон, что на такую-то марку, которая ему нравится, имеется специальное предложение. Подобные применения пока крайне редки, но в торговле, сфере финансовых услуг они считаются серьезным конкурентным преимуществом. Финансовый сектор заинтересован в технологиях, повышающих продажи и создающих перекрестные продажи, а торговля давно заждалась предсказаний потребительского поведения. Компании этих сфер бизнеса активно ищут технологических партнеров, таких как EMC, которые помогли бы воплотить описанную схему в жизнь.
Россия на этом пути далеко не в арьергарде. Благодаря серьезной математической школе, изобилию хороших программистов, здесь есть и центры разработок (у EMC их два – в Санкт-Петербурге, и Сколково), и клиенты, которые заинтересованы в применении этих разработок. Кроме таких типичных для всего мира потребителей, как торговля и банковский розничный бизнес, Большие Данные очень интересуют традиционно сильные в России компании нефтегазового сектора, поскольку выбор новых месторождений для разработки и создание оптимальных схем добычи и доставки сырья – типичные задачи по обработке Больших Данных.
В конечном счете, мы должны помочь клиентам монетизировать Большие Данные. И именно это является нашей задачей, как и задачей всей IT-индустрии на обозримое будущее.