Студент-первокурсник и его научная руководительница создали портал информации о распространении коронавируса по миру буквально за одну ночь. У этого сайта миллиарды просмотров в сутки!
Фото: jhu.edu
В декабре, когда в Китае появилась болезнь, которая сейчас известна как COVID-19, Дун Эньшен занимался совершенно другой инфекцией: в мире быстрыми темпами росла заболеваемость корью. (Каким пустяком это кажется сейчас!) Дун — студент-первокурсник Университета им. Джонса Хопкинса в Балтиморе, штат Мэриленд, его направление — «гражданская и системная инженерия», а специализация — «эпидемиология». Российской высшей школе такое сочетание покажется странным, но в нем есть логика: гражданское строительство и системное обеспечение жизни в мегаполисах не может не учитывать эпидемических ситуаций, должно быть к ним готово. Так вот, узнавши о быстром распространении нового коронавируса, Дун и его научная руководительница Лорен Гарднер решили, что оставят наблюдения за корью и переключатся на уханьскую инфекцию. 22 января решение было принято, на следующей день они уже выпустили в свет онлайн-ресурс, который отслеживал распространение инфекции.
Популярность коронавирусного ресурса Университета им. Джонса Хопкинса росла гораздо стремительнее, чем распространялся сам объект наблюдения. Портал быстро стал привычным задником для огромного числа новостных сайтов и телевизионных картинок во всем мире: нет сейчас темы интереснее коронавируса и нет источника, который бы так дотошно подходил к сбору данных о числе заболевших, выздоровевших и умерших от COVID-19.
Дун потратил на разработку и запуск сайта всего несколько часов, а просмотров у ресурса — миллиарды каждый день.
Исследовательская группа Лорен Гарднер, в которую, разумеется, входит и Дун, изучает, как поведение населения, прежде всего его мобильность, количество контактов и др., влияет на распространение инфекций разного рода. Группа Гарднер строит математические модели, с помощью которых определяет будущие центры распространения заразных заболеваний.
Внезапная вспышка COVID-19 — заболевания, вызванного коронавирусом SARS-CoV-2, в китайском Ухане дала Гарднер и ее группе уникальную возможность с самого возникновения инфекции собирать данные о том, как она распространяется, причем в режиме реального времени. Гарднер говорит, что она и ее коллеги могли бы, конечно, закрыть сведения и самостоятельно заниматься моделированием ситуации. Но они решили не быть собаками на сене и сделать данные доступными для всех желающих.
«А все-таки это было несколько неожиданное решение,— вспоминает она,— когда мы сказали друг другу: давайте создадим ресурс для сбора данных и будем продолжать собирать их, поддерживать этот сайт. И за ночь мы сделали этот ресурс!»
Лорен Гарднер уверяет, что в первую очередь целевой аудиторией их нового ресурса должны были стать ученые и медицинские работники — эпидемиологи, медицинские статистики, строящие модели распространения болезней. Но аудиторией портала стал буквально весь мир! Миллиард просмотров включает в себя не только проявление банального любопытства, указывает она, но видно, что многие из пользователей скачивают с сайта данные, а значит, первоначальная, исследовательская задача тоже решается.
Да и, конечно, никаких миллиардов не планировалось — они думали о сотнях или тысячах просмотров в день. «Мы были страшно удивлены, когда осознали, как популярны»,— говорит она.
Дун же вспоминает, что не видел никаких трудностей в создании портала, потому что перед вспышкой коронавируса они занимались выявлением и отслеживанием отправных точек распространения кори. Для этого исследователи использовали ArcGIS — инструмент геопространственного картографирования, разработанный калифорнийской компанией Esri для визуализации результатов моделирования. Поэтому с коронавирусом так быстро все и получилось.
Данные на портал поступают из самых разных источников: от неофициальных вроде социальных сетей до Всемирной организации здравоохранения, центров США по контролю и профилактике заболеваний, Европейского центра профилактики и контроля за заболеваниями, Национальной комиссии здравоохранения Китая, а также СМИ и министерств здравоохранения. по всему миру. Эти данные собираются, агрегируются и публикуются на GitHub, а оттуда, объясняет Дун, их выгружают на платформу Esri ArcGIS для визуализации.
Первоначально данные собирались и вводились вручную. Сперва этим занимался только Дун, потом еще и другие студенты, и работа стала круглосуточной. Но болезнь расширялась так быстро, что сами исследователи справляться с ними уже не могли.
Группа Гарднер стала искать, как автоматизировать сбор информации,— и сегодня данные пополняются в основном за счет автоматической выгрузки со множества ресурсов и агрегации других подобных ресурсов. Система эта настолько совершенна, что несколько раз оповещала о первом случае заболевания коронавирусом в какой-нибудь стране еще до того, как власти ее об этом узнавали и заявляли.
Код у всей системы открытый, с момента запуска качество работы Дуна высоко оценили 20 тыс. его коллег-профессионалов, он получил свыше 1,7 тыс. предложений, как улучшить систему, и значительной частью из них воспользовался, а еще 350 раз Дуну сообщали о наличии уязвимостей в системе.
Журнал Lancet Infectious Deseases 19 февраля опубликовал статью о работе Гарднер, Дуна и их коллег, эта статья уже процитирована 79 раз.
Гарднер жалуется, что удовлетворить все запросы не представляется возможным, даже ошибки не всегда удается сразу исправить: «Так много всего, что будь у нас сто человек, мы бы, может, и справились, наладили обратную связь с пользователями, улучшили бы наш портал, но увы! Значительная часть так и остается нереализованной!»
Справедливости ради надо сказать, что у Гарднер теперь не три человека в группе, а свыше двух десятков — к ним присоединились другие ее студенты, а еще студенты с факультета медиа и коммуникаций, сотрудники лаборатории прикладной физики Университета им. Джонса Хопкинса, а также работники компании Esri.
Но основную работу выполняют пятеро. «Мы все заслужили полноценный отпуск, и, когда все это успокоится и людям будет позволено общаться, мы отправимся путешествовать»,— мечтает Гарднер. Сколько часов в день она работает? «Все, какие есть»,— отвечает она.