Перспективное направление в ИТ – «большие данные» – пока малоизвестно многим компаниям, и еще меньше знакомо обывателям. Но влияние этой аналитической технологии на повседневную жизнь будет расти с каждым днем. Привлечь внимание к последствиям ее внедрения должен арт-проект The Human Face of Big Data, выполненный в виде мобильного приложения.
Постоянный сбор информации из каждого источника, анализ сверхбольших массивов плохо структурированных данных в реальном времени, нахождение закономерностей и скрытых взаимосвязей в окружающем мире – все эти особенности «больших данных» должно продемонстрировать участникам-добровольцам приложение The Human Face of Big Data, новый проект известного фотографа Рика Смолана. Спустя всего неделю после запуска, у создателей уже есть интересные открытия. Так, всего 8% женщин планеты никогда не задумывались о своем весе и том, что он может быть избыточным. А пользователи Android свежайшей версии вдвое реже, чем в среднем по популяции, верят в загробную жизнь. Практическую пользу из этих фактов организаторы извлекать не планируют, их цель – привлечь внимание бизнесменов, руководителей, но и просто обычных людей к возможностям и последствиям, которые возникают при использовании технологий «больших данных».
«Большие данные» - относительно новый термин, означающий хранение и оперативный анализ очень больших объемов слабо систематизированной информации. Благодаря различным цифровым сенсорам, развитию веба и социальных сетей, распространению смартфонов, сегодня компании могут получать гигантские массивы информации о своей деятельности и о своих клиентах. Первыми с этим столкнулись интернет-компании вроде Google, и они же первыми научились зарабатывать на анализе доступных знаний. Впечатляющая оптимизация бизнеса доступна и в других отраслях, но не всегда это очевидно владельцам. Еще чаще они, зная о возможности, не умеют анализировать информацию. В социальном плане очень важна и другая составляющая - обычные люди должны понимать, как много информации о них дают самые обычные повседневные действия и привычки, какие важные выводы может сделать заинтересованный наблюдатель, анализируя "цифровые следы" человека - от записей в соцсети до данных с видеокамер в метро.
Чтобы привлечь внимание к этим «цифровым следам», приложение The Human Face of Big Data задает пользователю целый ряд вопросов, начиная от простых о поле и возрасте и заканчивая весьма личными, такими как вопросы веры и секса. Рик Смолан, говорит, что провокационные вопросы выбраны намеренно - они заостряют внимание на том, что автоматизированная система пытается проникнуть в сферу, которую обычно обсуждают только с очень близкими людьми. Создатели, правда, гарантируют полную анонимность участникам, особенно если те пропустят ту часть анкеты, в которой нужно сфотографировать свое лицо. В качестве награды за участие доброволец может наглядно сравнить себя, свои взгляды и привычки с другими участниками и узнать, есть ли у него единомышленники. Занимается приложение и пассивным сбором данных – периодически фиксирует местоположение смартфона, считает количество устройств Bluetooth и Wi-Fi в зоне видимости, чтобы узнать, как активно перемещается владелец и со сколькими людьми вступает в соприкосновение.
Промежуточные результаты сбора и анализа данных можно в реальном времени отслеживать на сайте thehumanfaceofbigdata.com. Именно анализ в реальном времени и сопоставление слабо связанных фактов – ключевые отличия аналитики больших данных по сравнению с традиционными методиками. Описанные выше, а также другие сделанные в исследовании выводы будут включены в книгу The Human Face of Big Data, которую команда Смолана планирует выпустить в ноябре. Туда же войдут некоторые впечатляющие результаты применения «больших данных» в бизнесе, например, история аналитика Оливера Сенна, который сопоставил данные о погоде в Сингапуре с 830 миллионами записей, сделанных GPS-трекерами в сингапурских такси. Он ожидал подтверждения известной сингапурцам истины: во время ураганных ливней невозможно поймать такси, они все заняты. Истина оказалась иной – многие такси во время ливней просто уезжают в безлюдные места и не берут пассажиров. Поиск причин выявил, что у водителей такси в случае ДТП удерживают $1000 из зарплаты до окончательного выяснения виновников аварии, поэтому они предпочитают не работать в рискованных условиях.
Другой пример еще показательней. Исследователи Джон Гуттаг и Коллин Штульц проанализировали значительное количество электрокардиограмм пациентов, перенесших сердечный приступ, причем сосредоточились на «сомнительных» данных, которые врачи обычно не принимают во внимание из-за невозможности четких трактовок. В результате им удалось найти три отклонения в ЭКГ, которые сигнализируют о высоком риске повторного приступа в течение года, причем с летальным исходом. Современная методика не позволяет рассчитать этот риск для 70% пациентов, поэтому открытие значительно улучшит работу кардиологов.
Применение технологии «больших данных» в медицине, пожалуй, имеет самые большие перспективы: по оценке McKinsey Global Institute, система здравоохранения США при полном и творческом использовании доступных ей данных могла бы сэкономить более $300 млрд., из которых две трети принесло бы восьмипроцентное снижение госрасходов в этой сфере. Неудивительно, что компании, специализирующиеся на средствах хранения и обработки больших данных, ведут активную просветительскую работу в государственной и бизнес-среде, описывая перспективы технологии. В частности, проект The Human Face of Big Data был спонсирован корпорацией EMC2, одним из ключевых игроков корпоративного рынка систем хранения и анализа больших данных. Компания, впрочем, не влияет на концептуальную сторону проекта, а лишь предоставляет материальные ресурсы и специалистов по анализу данных, которые помогут сделать из собранной и обезличенной информации максимум выводов.