Инновации ради инноваций — не лучший способ инвестирования. Применение технологий может и должно вести к увеличению прибыли. Этой публикацией iOne начинает серию статей, посвященных ИТ, которые помогают бизнесу заработать по-настоящему большие деньги.
Исследовательская компания IDC предсказывает, что мировая индустрия больших данных вырастет к 2015 году до $17 млрд. Технологии по обработке и анализу огромных массивов информации пока новые и потому "сырые". Но уже сегодня в результате их применения компании серьезно увеличивают свои прибыли.
"Большие данные эквивалентны большой прибыли и большому доллару,— говорит Род Джонсон, вице-президент отраслевой стратегии Oracle.— Работа с ними — это не столько ИТ-стратегия, сколько повседневная возможность, которая должна быть обеспечена ИТ-департаментом". Oracle в результате прошлогоднего опроса топ-менеджеров 300 крупных промышленных компаний Северной Америки выяснила, что те теряют до 10% дохода в год из-за неспособности адекватно анализировать свои данные. В переводе на деньги это означает $40,8 млн ежегодно.
Отчетливый след
По словам Василия Васина, президента группы компаний R-Style, big data — это набор технологий сбора, хранения, анализа и представления данных, комплексно решающий проблемы, которые возникают при обработке финансовой информации, сведений из различных трансакционных систем, из поисковых сервисов и т. д. Также большие объемы неструктурированной информации генерируют социальные сети. Васин убежден, что сейчас мы находимся на восходящей волне информационной революции, связанной с появлением возможностей сбора, обработки и персонализации данных о людях, о каждом конкретном человеке. Если не затрагивать возможные отрицательные последствия, касающиеся разрушения понятия приватности, то для частного бизнеса и государства это дает очень многое. Анализ данных может раскрыть множество взаимосвязей между поведением людей, их образованием, склонностями, способностями, привычками, образом жизни. "Ценность информации и реальных данных о поведении людей, особенно в исторической ретроспективе, постоянно повышается,— подчеркивает Василий Васин.— Такая информация необходима каждому заинтересованному человеку".
Самый известный пример того, как big data работает на повышение прибыли,— интернет-магазин eBay. Компания отлично разбирается в больших данных: собирает и анализирует информацию о более чем 100 млн активных пользователей, участвующих в сделках на сумму $68,6 млрд (в 2011 году). Но мало кто знает, что eBay применяет аналитику больших данных также в совершенно неожиданной области. Несколько лет назад компания решила собирать информацию о функционировании собственной ИТ-инфраструктуры — детальные данные каждую минуту по каждому компоненту, установленному в дата-центре. Это позволило обнаружить незадействованные серверные мощности, неправильно сконфигурированные устройства и другие причины пониженной эффективности и в результате помогло сэкономить миллионы долларов.
В российской практике громких историй успеха использования big data пока нет. Но проекты по внедрению соответствующих решений в этой сфере уже ведутся. Например, суммарный объем данных, обрабатываемых в крупных федеральных географически распределенных структурах (ПФР, ФНС, Федеральное казначейство РФ) превышает 1 петабайт.
Департамент образования Москвы также сделал первый шаг к эффективному использованию big data. На сегодняшний день в рамках комплексной информационной системы "Государственные услуги в сфере образования в электронном виде" компания R-Style реализовала проект "НСИ и реестры". В результате приведена к единообразию нормативно-справочная информация, необходимая для предоставления государственных услуг в сфере образования в электронном виде и для внутриведомственных АИС.
Вся музыка мира
Во многих компаниях уже есть инструменты, которые можно эволюционно развить до уровня анализа big data. Александр Ланин, директор департамента интеграционных технологий R-Style, уверен, что особо отчетливо видят необходимость внедрения таких технологий организации, использующие веб-аналитику и глубокий анализ данных (так называемый data mining). Ланин рекомендует начать с пилотного проекта и оценить реальные выгоды до того, как внедрять полномасштабное решение. Главное — правильно поставить бизнес-задачу.
Василий Васин говорит, что тема больших данных тесно связана с вопросом консолидации вычислительных ресурсов организации. Рыночная практика такова, что на первом этапе, еще до внедрения решений по обработке big data, ресурсы и сами данные консолидируются в рамках одной технологической площадки. Ведь информация о клиентах и все остальные составляющие big data, как правило, хранятся во множестве информационных систем, в разных департаментах и филиалах. Чтобы правильно распорядиться информацией, необходимо собрать все эти сведения в одном хранилище и организовать доступ к нему для всех, кому это необходимо.
По этой причине в развитых странах количество центров обработки данных (ЦОД) с каждым годом сокращается, но размеры их становятся больше. Тогда как на развивающихся рынках преобладают многочисленные мелкомасштабные ЦОД. По оценкам Datacenter Dynamics, в 2011 году доля центров обработки данных площадью менее 250 кв. м в России составляла около 55%, в Бразилии — примерно 50%, в Мексике — 35-40%, во Франции — около 20%, в США — не более 5%. Напротив, доля ЦОД площадью 250-500 кв. м в России составила менее 5%.
В США еще в 2010 году была объявлена федеральная программа по консолидации ЦОД. По ней в стране будут закрыты 1200 из 2900 государственных дата-центров, а правительство страны сократит бюджетные расходы на $2,4-5 млрд. Аналитики IDC говорят, что число ЦОД в США уменьшится с сегодняшних 2,94 до 2,89 млн за четыре года. В то же время общее рабочее пространство дата-центров увеличится с 56,8 млн кв. м до 65 млн кв. м.
В России этот тренд еще не проявился в полной мере, но уже заметен. Сбербанк запустил масштабную программу консолидации вычислительных ресурсов. В конце прошлого года был сдан в эксплуатацию мегацентр ОД Сбербанка в Южном речном порту. Это первый в России центр обработки данных в финансовой отрасли, сертифицированный по уровню Tier III. Огромный дата-центр вместе с аналогичным мегацентром ОД в Сколково заменит десятки региональных. При этом совокупная стоимость владения ИТ-инфраструктурой должна быть снижена до $500 млн в год начиная с 2015 года.
ОАО "Электронная Москва" силами компании R-Style построила ЦОД на 300 стоек суммарной мощностью 7 МВт для правительства Москвы. Инфраструктура обеспечивает функционирование электронных систем столицы, предназначенных в том числе для оказания государственных услуг гражданам и юридическим лицам в электронном виде, а также для предоставления сервисов иным государственным и коммерческим компаниям.
"Основные операционные затраты при эксплуатации дата-центров приходятся на оплату электроэнергии,— комментирует директор департамента инженерных систем и телекоммуникаций R-Style Вячеслав Тихонов.— Консолидация вычислительных ресурсов приобретает в этом смысле новое значение.
Высокая экономия достигается путем консолидирования крупных ЦОД вблизи объектов генерации электроэнергии, таких как атомные электростанции, гидроэлектростанции, так как стоимость 1 кВт·ч там значительно ниже. В ближайшей перспективе большое распространение получат альтернативные источники энергоснабжения, такие как ветрогенераторы и генераторы электроэнергии на солнечных батареях. В США и Европе ЦОД консолидируются вокруг них".
По словам Василия Васина, рынок ЦОД в России отстает от развитых стран как минимум на пять лет, поэтому консолидация у нас только-только начинается. То есть большие выгоды из больших данных в России научатся получать не раньше чем к 2015-2017 году.