Как ученые исследуют свойства материи на суперкомпьютерах
Глобальная цель — решение задач по построению корреляций структура-свойство
Николай Кондратюк, кандидат физико-математических наук, заведующий лабораторией многомасштабного моделирования в физике мягкой материи МФТИ, рассказывает о возможностях современных численных методов в физике.
Молекула лекарства из базы данных AIRI, оптимизированная в водном окружении
Фото: Предоставлено МФТИ
Спектр задач в области компьютерного моделирования очень широкий, это видно даже на примере нашей лаборатории многомасштабного моделирования в физике мягкой материи в МФТИ. Мы рассматриваем материю на уровне атомов и рассчитываем их динамику, строим корреляции атомная структура — свойство. Весь плюс подхода в универсальности, опирающейся на базис естественных наук, на методы компьютерного моделирования и машинного обучения, а также вычислительные ресурсы (суперкомпьютеры). Комбинируя эти базовые элементы, мы прогнозируем свойства веществ для самых разных задач. Особую значимость играют методы машинного обучения, но для них необходимы базы данных, которые кто-то должен генерировать. Сегодня важна синергия между точными расчетами, экспериментами и машинно-обучаемыми подходами.
Перечисленные подходы позволяют создавать новые материалы под конкретные приложения, либо описывать процессы, происходящие на молекулярном уровне, например, в клетках при взаимодействии с лекарственными молекулами. Как раз такую задачу мы сейчас решаем вместе с лабораторией Артура Кадурина в AIRI (Artificial Intelligence Research Institute, Институт искусственного интеллекта — российская исследовательская организация). Они разработали нейронную сеть, которая предсказывает конформации молекул лекарств в вакууме по их структуре. Она работает гораздо быстрее, чем квантово-механические расчеты. В нескольких словах идея состоит в следующем. Мы предлагаем нейросети интересующую нас молекулу, а она отвечает: «О'кей, эта молекула похожа на те, на которых я обучалась. У нее будет вот такая энергия растворения и вот такая геометрия. Проверяйте». Если все совпадает, значит нейросеть работает отлично. Дальше можно делать прогноз свойств лекарственных молекул.
Наша команда накопила большой опыт по моделированию растворов органических молекул. Совместно с ИТМО мы провели исследование механизмов нуклеации цианурата меламина в воде. Эти соединения перспективны с точки зрения программируемой сборки функциональных материалов. С Владимиром Дещеней исследуем свойства сахаров в воде, с Иваном Бакулиным и Ильей Копаничуком опубликовали статью по нарушению сети водородных связей в воде при добавлении растворителя — 1,4-диоксана, опираясь на предыдущую работу. Поэтому мы с аспирантами Денисом Потаповым и Владимиром Дещеней предложили AIRI сотрудничество. Запросили их датасет и оптимизируем геометрию молекул в реальных растворителях (в воде, в спирте и проч.). Это следующий шаг решения задачи. Потом они уже на наших данных обучат нейронную сеть и смогут предсказывать геометрию лекарств в жидкостях. Дальше мы рассчитаем растворимость молекул и их взаимодействие с таргет-белками.
Вычислительная модель керогена второго типа, органической составляющей сланца. Исследуют как упругие свойства, диффузию метана в матрице керогена, так и термическое разложение
Фото: Предоставлено МФТИ
Нас очень вдохновляют работы, выполненные на стыке экспериментальных и вычислительных подходов. Выдающийся пример из них — это компания DE Shaw Research, построившая линейку собственных суперкомпьютеров и адаптирующая для них методы расчета. Сейчас их лекарства проходят испытания в реальности. Также с целью связать науку и индустрию проводятся международные конкурсы по прогнозу свойств промышленных жидкостей. Мы успешно участвовали в них в 2018 и 2019 годах, для конкурса 2023 года подготовили работу вместе с молодыми сотрудниками лаборатории — Олегом Кашуриным и Владимиром Дещеней. В ноябре отправили организаторам наши результаты по прогнозам вязкости смесей, для которых нет экспериментальных данных вообще. Наши прогнозы оказались точными — ошибка не более 10%, статья на стадии рецензии. Это соответствует мечтам компаний о цифровых лабораториях, дополняющих реальные эксперименты.
Еще одна из задач для молекулярного моделирования, которой в мире сейчас активно занимаются, и наша лаборатория в том числе, это трудноизвлекаемые нефтегазовые месторождения. Мы разрабатываем алгоритмы, которые позволят для разных составов жидкостей на органических и глинистых поверхностях рассчитывать контактные углы и поверхностное натяжение. Отдельным пунктом стоит моделирование керогенов — очень интересная тема. Это органическая составляющая сланца — очень древние отложения планктона, водорослей. Ученые до сих пор не представляют, какая структура у этих полимерных матриц. Компонентный состав у них очень сложно определить. Известно только соотношение углерода к водороду и углерода к кислороду. Из керогенов термическим образом добывают газ и нефть. Меня и коллег, Марию Алексееву и Михаила Логунова, интересует их классификация. Какие у них упругие свойства, компонентный состав? Каково их строение на атомарном уровне? Над этой тематикой мы работаем в сотрудничестве с учеными из нефтегазовой области — Алексеем Хлюпиным, Кириллом Герке, Сергеем Тихоцким.
Моя глобальная цель — это решение задач по построению корреляций структура-свойство, в коллаборации с экспериментаторами и промышленностью. Для этого, конечно, необходим мощный современный суперкомпьютер, и я верю, что он вскоре появится на Физтехе.
Настоящая работа выполняется в рамках Программы стратегического академического лидерства «Приоритет-2030» (соглашение 075–02–2021–1316 от 30.09.2021).