Машинный метод
Как российские ученые используют искусственный интеллект в исследованиях
Исследователи из Европейского космического агентства с помощью собственного алгоритма машинного обучения AnomalyMatch менее чем за три дня изучили около 100 млн фрагментов снимков космического телескопа «Хаббл» и выявили 1300 аномалий. За каждой может скрываться неизвестный объект во Вселенной, и около 800 из них ранее никто не замечал. Обычно на анализ вручную уходят месяцы и даже годы.
Внедрение машинного обучения меняет процесс научного поиска не только в астрономии. Алгоритмы помогают исследователям и в других дисциплинах анализировать данные, выдвигать новые гипотезы и проводить эксперименты. Как ИИ используют российские ученые в области геофизики, эпидемиологии, медицины, рассказывают на примерах собственных проектов студенты первого потока программы «ИИ в естественно-научных исследованиях» Школы анализа данных «Яндекса» (ШАД).
Науки о Земле: геофизика и энергия
Мария Смирнова — выпускница геологического факультета МГУ и аспирант Сколтеха по программе «Нефтегазовое дело». Она работает в команде профессора Сколтеха Ивана Кулакова над амбициозной задачей — поиск геотермальных источников, которые способны кардинально изменить энергосистему Камчатки.
Мария Смирнова
Фото: из личного архива
Мария Смирнова
Фото: из личного архива
В этом регионе уже действуют геотермальные электростанции (ГеоЭС). Станция у вулкана Мутновский, например, обеспечивает около 20% электроэнергии края. Такая энергия заметно дешевле и экологичнее той, что вырабатывают тепловые станции. Но чтобы развивать геотермальную энергетику дальше, нужно находить новые геотермальные проявления — а это сложная научная задача.
Для строительства ГеоЭС необходимо определить место, где температура высокая, а глубина до источника тепла минимальная. Чтобы получить эту информацию, ученые используют методы сейсмической томографии — анализируют колебания в земной поверхности. Эти колебания, называемые сейсмическими волнами, возникают по разным причинам: из-за землетрясений, техногенных процессов, движения магмы в вулканах. Самое важное — некоторые типы волн несут информацию о геотермальных процессах: именно они определяют, где находится возможный резервуар и какова его температура.
Для сбора данных на Камчатке и Курильских островах научной группой Сколтеха и их коллегами установлены десятки сейсмоприемников. Каждый из них фиксирует сейсмические колебания, записывая информацию в виде сейсмограмм. При этом «форма» сейсмических волн различна: большое региональное землетрясение сильно отличается от локальных подвижек.
Сейчас первичная обработка данных — разметка сейсмотрасс — делается преимущественно вручную. Процесс кропотливый и долгий, к тому же результаты порой зависят от субъективного взгляда исследователя. Вот почему Мария Смирнова видит в ИИ реальный шанс ускорить и усовершенствовать работу. С помощью машинного обучения можно решить сразу две задачи. Во-первых, автоматизировать разметку сейсмотрасс: модель научится отличать сейсмические волны от шума, существенно сократив время на первичную обработку. Во-вторых, классифицировать сейсмические события — разделять их на группы по природе возникновения. Это позволит исследователям почти сразу переходить к анализу данных, быстрее понимать, какие процессы стоят за колебаниями, и оценивать геотермальный потенциал района.
Такие возможности откроют новые перспективы: ученые смогут оперативнее выбирать места для новых ГеоЭС, точнее планировать развитие энергосистемы региона и в целом двигать вперед геотермальную энергетику Камчатки. При этом Мария подчеркивает: ИИ не заменит геофизиков. Природные объекты слишком разнообразны и непредсказуемы. Модели необходимо дообучать на различных данных. Поэтому ИИ может стать мощным инструментом в руках ученых — тем, что поможет им работать эффективнее, не подменяя человеческого опыта и интуиции.
Эпидемиология: прогнозы в масштабе городов и стран
Дарья Неверова — кандидат физико-математических наук, доцент и научный сотрудник Математического института им. С. М. Никольского РУДН, старший научный сотрудник центра научного развития «Математика — перспективным молодым». В ШАД она поступила с убеждением, что искусственный интеллект способен серьезно улучшить прогнозы распространения инфекций и вести борьбу с эпидемиями эффективнее.
Дарья Неверова
Фото: из личного архива
Дарья Неверова
Фото: из личного архива
Проблема в том, что сегодня эпидемиологи опираются на классические математические модели, которые слишком упрощают реальность. В этих моделях население делят на несколько базовых групп — уязвимые, заболевшие, выздоровевшие, но не учитывают множество важных факторов. Среди них — свойства самого возбудителя, образ жизни людей, их возраст, иммунный статус и место проживания. Недостаточная точность таких прогнозов стала особенно очевидна во время пандемии COVID-19. Люди быстро адаптировались: носили маски, переходили на удаленную работу, избегали людных мест. Но традиционные модели не предусматривали подобных изменений в поведении и поэтому регулярно завышали ожидаемый уровень заболеваемости.
Есть и другие нюансы, ускользающие от классического моделирования. Например, между заражением и появлением симптомов, обращением к врачу и госпитализацией проходят дни — эти задержки влияют на динамику эпидемии, но редко попадают в расчеты. Кроме того, инфекция распространяется по-разному в зависимости от места: два соседних района могут быть слабо связаны, если между ними нет общих социальных точек — школ или станций метро. Особую роль играют и замкнутые коллективы: в общежитиях или интернатах плотные контакты между людьми способны вызвать локальную вспышку даже на фоне низкой общей заболеваемости.
Чтобы учесть все эти тонкости, Дарья Неверова планирует применить современные методы машинного обучения. Один из них — нейросети, которые учатся не только на предоставленных им данных, но и на уже известных законах эпидемиологии. Это позволяет модели учитывать, как в принципе развивается заболевание, даже если в имеющемся датасете информации о путях распространения инфекции недостаточно.
Есть и другой подход. Это моделирование распространения заболевания в виде графовой нейросети. В этом случае каждый район и город — узел, а контакты между ними — связи: одни активно взаимодействуют друг с другом, другие — почти нет. Такая модель позволяет точнее учитывать реальные контакты между людьми и понимать, как именно болезнь передвигается в пространстве.
В результате нейросеть сможет для каждой группы населения определить, скольким людям в среднем передает инфекцию один заболевший. На первом этапе целевая точность прогноза составляет около 80–85% — этого уже достаточно, чтобы проверить работоспособность подхода. В дальнейшем методика позволит еще точнее прогнозировать уровень заболеваемости и подбирать наиболее эффективные меры для сдерживания эпидемий. Таким образом, сочетание глубокого понимания эпидемиологии и возможностей ИИ может вывести прогнозирование инфекций на новый уровень, сделать его гибким, детализированным и адаптированным к реальной жизни.
Медицина: индивидуальный подход к протезированию с точным расчетом
ИИ необходим, чтобы обеспечить не только масштабные исследования с широким охватом, но и для учета конкретных особенностей пациентов. Так, Алиса Суфэльфа, кандидат технических наук и начальник отдела цифровых технологий протезирования Института протезирования и ортезирования в Центре Альбрехта Минтруда России, занимается сбором и разметкой данных для обучения нейросети — помощника протезиста.
Алиса Суфэльфа
Фото: из личного архива
Алиса Суфэльфа
Фото: из личного архива
Идея в том, чтобы ИИ проектировал по 3D-скану культи (усеченной конечности) индивидуальный модуль протеза, который непосредственно соприкасается с телом. При создании протезов голеней нужно учитывать заболевания суставов и сосудов, структуру остаточных костей, повышенную кожную чувствительность, зоны рубцевания. Это почти полностью ручной труд, поясняет исследовательница: «Протезист снимает слепок с культи пациента, сам обрабатывает гипсовую заготовку и делает по ней термопластовую приемную гильзу протеза».
В некоторых протезно-ортопедических мастерских вместо этого строят цифровую модель приемной гильзы, что тоже требует многочасовой работы специалиста высокой квалификации. Поэтому исследователи планируют обучить ИИ на данных об анатомии, распространенных формах индивидуальных модулей протезов, типовых областях перераспределения нагрузки приемной гильзы. Ожидается, что в результате изготовление ускорится в девять раз и будет состоять из таких шагов: оптическое сканирование культи, предварительная обработка скана и проектирование модели индивидуального модуля протеза (с использованием ИИ), печать модуля на 3D-принтере, сборка протеза и выдача пациенту.
Работа с ИИ в исследованиях продолжается
В естественных науках машинное обучение пока только входит в повседневную практику. Нейросети «проходят стажировку» в лабораториях: учатся соблюдать законы геофизики и биологии, сокращают время на рутинные задачи и помогают ученым фокусироваться на экспериментах и конечном результате исследований.
Однако, чтобы ИИ работал эффективно, нужно правильно его настроить: подобрать подходящую модель, задать верные параметры и грамотно интерпретировать полученные данные. Это значит, что ученым сегодня важно владеть не только предметной экспертизой, но и базовыми навыками работы с машинным обучением.
Решить эту задачу помогают специализированные образовательные программы — например, направление подготовки «ИИ в естественно-научных исследованиях» в Школе анализа данных «Яндекса», где сейчас снова открыт набор. Там обучают исследователей нового формата, которые на практике осваивают методы ИИ, применяют их к своим научным задачам, работают над собственными проектами и получают поддержку как от ИИ-специалистов, так и от экспертов в своей области.