Коммерсантъ FM

Машинное обучение меняет химию и физику

Новые материалы создаются при деятельном участии искусственного интеллекта

Люди всегда искали новые материалы. Сегодня им в этом помогает искусственный интеллект. Никита Казеев, выпускник Школы анализа данных «Яндекса» и сотрудник лаборатории нобелевского лауреата Константина Новоселова, рассказывает «Ъ-Науке», как машинное обучение открывает катализаторы и повышает эффективность солнечных панелей.

Фото: Виктор Коротаев, Коммерсантъ

Фото: Виктор Коротаев, Коммерсантъ

— Я занимаюсь применением машинного обучения для поиска новых материалов в группе нобелевского лауреата Константина Новоселова. Поиск материалов — давнее увлечение человечества. В доисторические времена освоение нового материала было настолько революционным, что в его честь называли целые периоды: каменный век, бронзовый, железный. Новые материалы радикально меняли жизнь людей, позволяя производить более эффективные орудия, быстрее строить дома, проще добывать пищу и т. д.

Какими будут материалы

Следующая революция произойдет, когда появится высокотемпературный сверхпроводник — он нужен для передачи энергии на огромные расстояния без потерь, повышения эффективности поездов на магнитной подушке, очистки воды и других задач. В идеале сверхпроводники должны работать при комнатных условиях, но пока этого не удалось достичь.

Раньше материалы создавали методом проб и ошибок. Кто-то что-то смешивал, экспериментировал, что-то получалось, а что-то — нет. Постепенно появились теории, обобщающие этот опыт. Специалисты измеряли, сколько нужно добавлять углерода к железу, чтобы получалась сталь определенной хрупкости, и выводили уравнения таких зависимостей. Пытались предсказать существование материала теоретически, а затем находили его экспериментально.

Компьютерные симуляции позволили отказаться от дорогостоящих поисковых экспериментов. Можно взять и считать, какой сплав получится, если смешать железо и никель в определенной пропорции, хватит ли ему прочности или нет. Такое моделирование заменило этап проб и ошибок на вычислительный, когда компьютер перебирает возможные варианты материалов. Но симуляция требует компьютерных ресурсов. Например, в нашем проекте расчет статических свойств небольших структур из 192 атомов занимает сутки и требует 24 ядер процессора. В сложных проектах с миллионом атомов нужна уже неделя расчетов на специализированном суперкомпьютере с тысячами ядер.

В целом задачу создания новых материалов можно свести к перебору множества структур. У нас есть вся таблица Менделеева, из которой можно собирать варианты. Важен не только состав, но и пространственная конфигурация, которая зависит от процесса производства: тот же углерод может стать графитом, алмазом или графеном, не говоря даже про органические молекулы. Перебор — долгий процесс даже при использовании компьютерного моделирования.

Как машинное обучение открывает новые материалы

Следующий этап эволюции — призвать на помощь искусственный интеллект. Сделав несколько тысяч расчетов и изучив алгоритм машинного обучения, мы получим возможность в сотни и тысячи раз быстрее моделировать другие похожие системы и динамические процессы. Более новое и «творческое» применение искусственного интеллекта — предлагать варианты материала для рассмотрения, а не просто быстро валидировать варианты, перебираемые человеком.

Большинство традиционных материалов имеют фиксированные свойства: например, они только гибкие или жесткие. Цель нашей лаборатории — создавать «умные» адаптивные материалы, свойства которых могут динамически меняться. Это важно для разработки искусственных органов, «умных» фильтров для воды, нового поколения аккумуляторов и других прикладных задач.

Компьютерное моделирование вещества требует перехода между масштабами — от отдельных атомов и пикосекунд к макроскопическим системам и временам. Это особенно актуально для «умных» материалов: чтобы появились динамические свойства, необходимы нетривиальные структуры, и им нужно время, чтобы сработать. Машинное обучение позволяет обучиться на точных квантовых расчетах различных вариантов атомных конфигураций и перейти к более масштабному моделированию. Или вообще построить эмпирическую модель по экспериментальным данным.

К примеру, ученые из MIT недавно внедрили машинное обучение для создания материалов для 3D-печати с нужными характеристиками вроде жесткости и упругости. Их алгоритм подсказывает полезные химические соединения, которые люди могли пропустить. С его помощью исследователи смогли создать чернила для 3D-печати, которые затвердевают под воздействием ультрафиолетового света. Это сложная задача: материал должен быть достаточно вязким, жестким и прочным. При ручном подходе химики тестировали бы каждое соединение по очереди, пытаясь максимизировать одну характеристику за раз. Результатом стали бы множество экспериментов и куча отходов. Машинное обучение определило 12 лучших материалов с оптимальным сочетанием всех трех свойств после проверки всего лишь 120 образцов.

По сути, машинное обучение становится обычным инструментом современной науки. Меня ему научили в Школе анализа данных «Яндекса». ШАД вообще полезна для начинающих ученых: в науке много рутины, но подлинные прорывы требуют рождения новых решений и принципов. Нужно сидеть и думать, как решить ту или иную задачку. Обучение в ШАД во многом состоит из работы именно в таком режиме.

Как новые материалы приближают будущее

Без новых материалов в будущее попасть не удастся: они должны совершить следующую технологическую революцию. Чтобы создать космический лифт, нам потребуется материал, который выдержит нагрузку. Для развития зеленой энергетики нужны эффективные солнечные батареи — и здесь не обойтись без более эффективных материалов.

К примеру, перовскиты — это семейство материалов, которые позволяют делать более тонкие и легкие солнечные панели, чем используются сейчас. Проблема в том, что они очень сложны в производстве. Исследователи из MIT и Стэнфорда использовали машинное обучение для обобщения экспериментальных данных. Результатом стало производство перовскитных элементов с эффективностью преобразования энергии 18,5%. Это высокий уровень для современного рынка.

Другой потенциальный способ получения чистой энергии — добавление в воду катализатора, который под действием солнечного света будет производить водород и кислород. Получается самое экологически чистое топливо с минимумом затрат. Проблема — в создании катализатора, который должен не только работать, но и быть простым и дешевым в производстве. В 2021 году прошел Open Catalyst Challenge, чтобы популяризовать применение машинного обучения в поиске недорогих катализаторов, способных запускать реакции для преобразования возобновляемой энергии в удобную для хранения форму. Участники соревнования должны были разработать ML-алгоритмы для имитации более 660 тыс. расчетов свойств катализатора. Победивший алгоритм Graformer предсказывает конфигурацию с минимальной энергией с точностью 89% — это позволит сократить не менее половины расходов при расчетах. Кстати, наши соавторы из Иннополиса заняли второе место.

В будущем нас ждет еще больше вычислительных мощностей — и больше данных. Обученные на «всем интернете» модели для работы с текстами и изображениями качественно превосходят все, что было раньше. Например, я переводил часть своей диссертации на русский язык с помощью машинного перевода: получилось всего по одной ошибке на несколько предложений, и это для сложного научного текста. Рано или поздно мы придем к подобному уровню и для материалов. Проанализировав миллиарды рассчитанных структур, алгоритм ответит, из чего сделать космический лифт и шнурки, которые не будут развязываться.

Подготовила Мария Грибова

Новости компаний Все

Загрузка новости...
Загрузка новости...
Загрузка новости...
Загрузка новости...
Загрузка новости...
Загрузка новости...
Загрузка новости...
Загрузка новости...
Загрузка новости...
Загрузка новости...
Загрузка новости...