Зараза со всего мира

Как в Университете им. Джонса Хопкинса заработал сайт о коронавирусе

Студент-первокурсник и его научная руководительница создали портал информации о распространении коронавируса по миру буквально за одну ночь. У этого сайта миллиарды просмотров в сутки!

Фото: jhu.edu

Фото: jhu.edu

В декабре, когда в Китае появилась болезнь, которая сейчас известна как COVID-19, Дун Эньшен занимался совершенно другой инфекцией: в мире быстрыми темпами росла заболеваемость корью. (Каким пустяком это кажется сейчас!) Дун — студент-первокурсник Университета им. Джонса Хопкинса в Балтиморе, штат Мэриленд, его направление — «гражданская и системная инженерия», а специализация — «эпидемиология». Российской высшей школе такое сочетание покажется странным, но в нем есть логика: гражданское строительство и системное обеспечение жизни в мегаполисах не может не учитывать эпидемических ситуаций, должно быть к ним готово. Так вот, узнавши о быстром распространении нового коронавируса, Дун и его научная руководительница Лорен Гарднер решили, что оставят наблюдения за корью и переключатся на уханьскую инфекцию. 22 января решение было принято, на следующей день они уже выпустили в свет онлайн-ресурс, который отслеживал распространение инфекции.

Популярность коронавирусного ресурса Университета им. Джонса Хопкинса росла гораздо стремительнее, чем распространялся сам объект наблюдения. Портал быстро стал привычным задником для огромного числа новостных сайтов и телевизионных картинок во всем мире: нет сейчас темы интереснее коронавируса и нет источника, который бы так дотошно подходил к сбору данных о числе заболевших, выздоровевших и умерших от COVID-19.

Дун потратил на разработку и запуск сайта всего несколько часов, а просмотров у ресурса — миллиарды каждый день.

Исследовательская группа Лорен Гарднер, в которую, разумеется, входит и Дун, изучает, как поведение населения, прежде всего его мобильность, количество контактов и др., влияет на распространение инфекций разного рода. Группа Гарднер строит математические модели, с помощью которых определяет будущие центры распространения заразных заболеваний.

Внезапная вспышка COVID-19 — заболевания, вызванного коронавирусом SARS-CoV-2, в китайском Ухане дала Гарднер и ее группе уникальную возможность с самого возникновения инфекции собирать данные о том, как она распространяется, причем в режиме реального времени. Гарднер говорит, что она и ее коллеги могли бы, конечно, закрыть сведения и самостоятельно заниматься моделированием ситуации. Но они решили не быть собаками на сене и сделать данные доступными для всех желающих.

«А все-таки это было несколько неожиданное решение,— вспоминает она,— когда мы сказали друг другу: давайте создадим ресурс для сбора данных и будем продолжать собирать их, поддерживать этот сайт. И за ночь мы сделали этот ресурс!»

Лорен Гарднер уверяет, что в первую очередь целевой аудиторией их нового ресурса должны были стать ученые и медицинские работники — эпидемиологи, медицинские статистики, строящие модели распространения болезней. Но аудиторией портала стал буквально весь мир! Миллиард просмотров включает в себя не только проявление банального любопытства, указывает она, но видно, что многие из пользователей скачивают с сайта данные, а значит, первоначальная, исследовательская задача тоже решается.

Да и, конечно, никаких миллиардов не планировалось — они думали о сотнях или тысячах просмотров в день. «Мы были страшно удивлены, когда осознали, как популярны»,— говорит она.

Дун же вспоминает, что не видел никаких трудностей в создании портала, потому что перед вспышкой коронавируса они занимались выявлением и отслеживанием отправных точек распространения кори. Для этого исследователи использовали ArcGIS — инструмент геопространственного картографирования, разработанный калифорнийской компанией Esri для визуализации результатов моделирования. Поэтому с коронавирусом так быстро все и получилось.

Данные на портал поступают из самых разных источников: от неофициальных вроде социальных сетей до Всемирной организации здравоохранения, центров США по контролю и профилактике заболеваний, Европейского центра профилактики и контроля за заболеваниями, Национальной комиссии здравоохранения Китая, а также СМИ и министерств здравоохранения. по всему миру. Эти данные собираются, агрегируются и публикуются на GitHub, а оттуда, объясняет Дун, их выгружают на платформу Esri ArcGIS для визуализации.

Первоначально данные собирались и вводились вручную. Сперва этим занимался только Дун, потом еще и другие студенты, и работа стала круглосуточной. Но болезнь расширялась так быстро, что сами исследователи справляться с ними уже не могли.

Группа Гарднер стала искать, как автоматизировать сбор информации,— и сегодня данные пополняются в основном за счет автоматической выгрузки со множества ресурсов и агрегации других подобных ресурсов. Система эта настолько совершенна, что несколько раз оповещала о первом случае заболевания коронавирусом в какой-нибудь стране еще до того, как власти ее об этом узнавали и заявляли.

Код у всей системы открытый, с момента запуска качество работы Дуна высоко оценили 20 тыс. его коллег-профессионалов, он получил свыше 1,7 тыс. предложений, как улучшить систему, и значительной частью из них воспользовался, а еще 350 раз Дуну сообщали о наличии уязвимостей в системе.

Журнал Lancet Infectious Deseases 19 февраля опубликовал статью о работе Гарднер, Дуна и их коллег, эта статья уже процитирована 79 раз.

Гарднер жалуется, что удовлетворить все запросы не представляется возможным, даже ошибки не всегда удается сразу исправить: «Так много всего, что будь у нас сто человек, мы бы, может, и справились, наладили обратную связь с пользователями, улучшили бы наш портал, но увы! Значительная часть так и остается нереализованной!»

Справедливости ради надо сказать, что у Гарднер теперь не три человека в группе, а свыше двух десятков — к ним присоединились другие ее студенты, а еще студенты с факультета медиа и коммуникаций, сотрудники лаборатории прикладной физики Университета им. Джонса Хопкинса, а также работники компании Esri.

Но основную работу выполняют пятеро. «Мы все заслужили полноценный отпуск, и, когда все это успокоится и людям будет позволено общаться, мы отправимся путешествовать»,— мечтает Гарднер. Сколько часов в день она работает? «Все, какие есть»,— отвечает она.

Анатолий Кривов

Загрузка новости...
Загрузка новости...
Загрузка новости...
Загрузка новости...
Загрузка новости...
Загрузка новости...
Загрузка новости...
Загрузка новости...
Загрузка новости...
Загрузка новости...
Загрузка новости...